-
小米 14 / Pro 获得大师人像、AISP 功能更新推送
今日,小米14和小米14Pro手机迎来了重要的系统更新。此次更新的一大亮点在于,小米14Ultra的出色影像功能被下放至这两款手机上,为用户带来了更为卓越的拍照体验。 更新内容中,新增的大师人像功能备受瞩目,它提供了大师人像和徕卡人像两种画质风格,为用户的...
-
英伟达竞品来了,训练比H100快70%,英特尔发最新AI加速卡
英伟达的 AI 加速卡,现在有了旗鼓相当的对手。 今天凌晨,英特尔在 Vision 2024 大会上展示了 Gaudi 3,这是其子公司 Habana Labs 的最新一代高性能人工智能加速器。 Gaudi 3 将于 2024 年第三季度推出,英特尔现...
-
AI日报:GPT-4-Turbo正式版自带读图能力;Gemini1.5Pro开放API;SD3将于4月中旬发布;抖音宫崎骏AI特效爆火
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ???AI新鲜事 OpenAI发...
-
陈巍:LLaMA-2的多模态版本架构与训练详解(收录于GPT-4/ChatGPT技术与产业分析)
陈巍:2023年9月,Meta的研究人员推出了AnyMAL(任意模态增强语言模型,Any-Modality Augmented Language Model)。该模型能够理解多种模态信号并生成文本回应,即多模态输入,单模态输出。输入的模态可包括图像、视频、...
-
离谱!AI超市「无人」收款,1000个印度人藏在背后……
就离谱,都2024了,人工智能靠人工的戏码还在上演。 而且是类似ATM机背后坐真·柜员给你递钱的那种! 当你走进一家超市,挑选完商品,无需人工、自助结账,直接拿好东西走人,等待一段时间,AI就能基于视频识别出你选了哪些东西,然后把账单发送过来,你只需点...
-
tldraw官网体验入口 免费在线AI即时协作绘图工具使用地址
tldraw是一款免费的、即时协作的绘图工具。它提供了丰富的图形元素和绘图功能,可以帮助用户快速创建各种类型的图表和流程图。tldraw 允许用户在白板上绘制 UI,并使用 GPT-4 Turbo 和 Vision 来生成由真实代码支持的工作网站。它支持多...
-
宝藏AI绘画工具,国内能打开使用Midjourney接口,无限制数量,新手免费体验!
前言 自从AI火了之后,各式各样的 AI 网站和工具层出不穷,像是比较出名的 ChatGPT、Midjourney、Stable Diffusion 等,全网几乎都在聊。 网上超级多的博主打着免费的幌子推荐各种杂七杂八的AI网站,结果都是收费的而且有...
-
Devin背后技术浮出水面!居然是OpenAI推出新版本GPT-4 Vision!网友:这视觉版本,正是我想要的!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 就在今天,GPT-4推出重磅更新!带视觉能力的GPT-4面向大众公开了! 图片 MiraOpenAI首席技术官Mira在推特上公布了这一消息。 图片 据OpenAI API官方介绍...
-
Diffusion-RWKV官网体验入口 AI生成高质量图像工具使用地址
Diffusion-RWKV是一种基于RWKV架构的扩散模型,旨在提高扩散模型的可扩展性。它针对图像生成任务进行了相应的优化和改进,可以生成高质量的图像。该模型支持无条件和类条件训练,具有较好的性能和可扩展性。 点击前往Diffusion-RWKV官网体...
-
AI绘图:Stable Diffusion ComfyUI局部重绘与智能扩图全面教程
前言 在数字艺术创作中,局部重绘和智能扩图是两个非常重要的功能。局部重绘允许我们在保留原有图像的基础上,对特定区域进行修改或创新。而智能扩图则能够帮助我们在图像的边缘添加新的元素,从而扩展图像的内容。本文将详细介绍如何在Stable Diffusion...
-
万变不离AI!直击 Google Cloud Next 2024 大会更多细节,不只Gemini 1.5 Pro !
AI显然成了谷歌Cloud Next 2024的一条主线! 这一在拉斯维加斯举行的技术大会,自周二起持续至周四,谷歌宣布了大量新的以云为中心的产品和服务,涵盖从Gemin、平台、Workspace到网络安全工具等一切内容。 Google Cloud Ne...
-
超能画布体验入口 百度AI写真、局部重绘创作平台免费使用入口
超能画布是百度网盘荣誉出品的AI创意生成工具,能够根据您上传的人像图片自动生成各种风格的创意图像,如写实、唯美、奇幻等,帮助摄影师提高工作效率,为每个人实现图像创意。该工具提供免费试用,并有灵活的付费模式满足不同需求。 点击前往超能画布体验入口 谁可以从...
-
每周AI新闻(2024年第11周)Meta公布Llama 3集群细节 | Sora将于年内推出 | 全球首个AI软件工程师发布
这里是陌小北,一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的,背诗的里面最会写段子的,写段子的里面代码写得最好的…厨子。 每周日解读每周AI大事件。 欢迎关注同名公众号【陌北有棵树】,关注AI最新技术与资讯。 大厂动向 M...
-
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨天的谷歌Next大会可是太精彩了,谷歌一连放出不少炸弹。 - 升级「视频版」Imagen 2.0,下场AI视频模型大混战 - 发布时被Sora光环掩盖的Gemini 1.5 Pro,正式开放 - 首款Arm架构CPU发布,全面对垒微软/亚马逊/英伟达/...
-
Google Vids官网体验入口 谷歌视频编辑AI创作工具在线使用地址
Google Vids是一款强大的在线视频编辑器,集成了谷歌Gemini技术,为您提供AI驱动的视频创作解决方案。您可以使用它快速创建富媒体视频内容,适用于工作、项目演示、教学等多种场景。Google Vids支持全面的视频编辑功能,包括剪辑、转场特效、字...
-
零基础搭建Stable Diffusion绘图环境
本节将介绍如何部署Stable Diffusion 绘图环境。部署Stable Diffusion绘图环境有两种方式: 云端部署:云端部署不需要特殊的网络设置,对电脑配置也没有要求。平均花费是1~2块钱/小时。 本地部署:本地部署在自己的电脑上安装...
-
基于数据正则化自博弈强化学习的人类兼容型自动驾驶
自动驾驶汽车面临的一个核心挑战是如何与人类合作。因此,在模拟环境中,将现实中的人类代理纳入到自主驾驶系统的可扩展训练和评估中至关重要。模拟代理通常是通过模仿大规模、高质量的人类驾驶数据集来开发的。然而,纯粹的模仿学习代理在多代理闭环环境中执行时经验上具...
-
刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁
【新智元导读】初创团队Mistral AI再次放出一条磁力链,281GB文件解禁了最新的8x22B MoE模型。 一条磁力链,Mistral AI又来闷声不响搞事情。 281.24GB文件中,竟是全新8x22B MOE模型! 全新MoE模型共有56层,...
-
好低调!字节Dreamina全面开放内测了,效果够惊艳吗?Ta眼中的“Sora女士”原来是这样!
字节Dreamina的内测范围扩大了!一个月前小编填写过一次内测收集问卷,当时并未拿到初始100人(据说)的名额。 图片 但在今天上午再次申请后,下午便惊喜地发现已经开通了Dreamina的文生视频功能! 再次申请只需选择两个问题,一是有无AI视频产品的...
-
Spotify AI Playlist官网体验入口 个性化音乐播放列表AI生成工具使用地址
Spotify AI Playlist是一款供 Spotify Premium 用户使用的音乐智能播放列表工具。用户可以通过输入特定提示来自动生成个性化的音乐播放列表,无论是新手还是专业用户都能轻松使用。AI Playlist 结合了强大的个性化技术和人工...
-
Microsoft Copilot (Bing Chat)
Copilot: Your everyday AI companion (你每天的AI伙伴) Bing AI - 搜索 Microsoft Copilot: 你的日常 AI 助手 Copilot|Designer: Create images f...
-
94岁诺奖得主希格斯去世,曾预言「上帝粒子」的存在
一位 94 岁伟大科学家的逝世,引发了人们广泛的哀思。 4 月 10 日消息,诺贝尔物理学奖得主、著名物理学家彼得・希格斯(Peter Higgs)于周一去世,享年 94 岁。希格斯因提出希格斯玻色子也被称为「上帝粒子」而闻名。 根据爱丁堡大学的一份声...
-
百度网盘推出AI创意生成工具“超能画布”
百度网盘近日推出了一款名为“超能画布”的AI创意生成工具,专为人像摄影量身打造。这款工具凭借其独特的图像大模型和智能人脸融合算法,让摄影师们能够通过简单的操作,实现创意的无限延伸。 在超能画布中,用户仅需上传一张照片,并输入相应的文字指令,即可在短短一分钟...
-
AI写作工具:智能化撰稿,颠覆传统写作
1. AI写作工具的兴起 近年,随着人工智能领域的突破性进展,AI写作工具进入公众视线,且被众多行业广泛采用。此项创新采用深度学习及自然语言处理技术,协助用户迅速产出高品质的文章、新闻以及博文等。这种智能创作模式提升了生产效率,让使用者省去冗余的时间与精...
-
Llama架构比不上GPT2?神奇token提升10倍记忆?
一个 7B 规模的语言模型 LLM 能存储多少人类知识?如何量化这一数值?训练时间、模型架构的不同将如何影响这一数值?浮点数压缩 quantization、混合专家模型 MoE、以及数据质量的差异 (百科知识 vs 网络垃圾 又将对 LLM 的知识容量...
-
美国新法案要AI公司透露用于训练AI模型受版权保护的作品
美国国会于周二提出了一项法案,旨在强制人工智能公司透露他们用于训练生成 AI 模型的受版权保护的材料。这项立法进一步加入了立法者、新闻机构和艺术家为了确定 AI 公司如何使用诸如歌曲、视觉艺术、书籍和电影等创作作品来训练他们的软件,并且这些公司是否违法侵犯...
-
生物识别技术是访问控制的未来吗?
在人类历史上,很难想象我们进入建筑物时不需要安全入口。从雕刻的木棒到无处不在的金属工具,再到更现代的钥匙卡,甚至更先进的密码,钥匙已经为这一目的服务了千万年。然而,在过去的几年里,随着生物识别技术在建筑环境中作为“虚拟钥匙”的使用变得越来越普遍,高科技...
-
ELLA官网体验入口 腾讯AI文本到图像语义对齐工具使用介绍
ELLA是一种轻量级方法,可将现有的基于CLIP的扩散模型配备强大的LLM。ELLA提高了模型的提示跟随能力,使文本到图像模型能够理解长文本。我们设计了一个时间感知语义连接器,从预训练的LLM中提取各种去噪阶段的时间步骤相关条件。我们的TSC动态地适应了不...
-
GPT-5:我们期待看到的4个新功能
尽管我们不知道GPT-5何时发布,但是我们依然可以期待一下GPT-5的新功能。 OpenAI的GPT-4目前是市场上最好的生成式AI工具,但这并不意味着我们不展望未来。随着OpenAI首席执行官Sam Altman定期暗示GPT-5的信息,似乎我们不久将...
-
facet ai怎么用?AI图片编辑修图工具Facet AI详细使用教程(附产品入口)
产品简介: FacetAI是一款创新的图像编辑工具,以实时图像生成和精确控制图像元素为核心优势,为广告制作和产品图像设计领域带来革命性变化。用户可通过直观的画布操作实现对图像元素的精准控制,提高工作效率。 Fac...
-
AIGC-Stable Diffusion发展及原理总结
目录 一. AIGC介绍 1. 介绍 2. AIGC商业化方向 3. AIGC是技术集合 4. AIGC发展三要素 4.1 数据 4.2 算力 4.3 算法 4.3.1 多模态模型CLIP 4.3.2 图像生成模型 二. Stable...
-
构建数字化、脱碳能源未来:技术驱动的绿色转型
在全球气候变化日益严峻的背景下,人类面临着严重的气候和能源危机。为了实现可持续发展和保护地球家园,我们需要采取积极的行动,转向数字化、脱碳的能源未来。今天,我们简要探讨如何利用人工智能、物联网、大数据等技术,解决当前的气候和能源挑战,打造绿色、低碳的未...
-
MediaTek DaVinci GenAI Platform官网体验入口 联发科生成式AI平台使用地址
MediaTek DaVinci GenAI Platform是一个强大的生成式AI平台,能提供自然流畅的人工智能对话体验,充当个人助理。平台还能整合多种信息源,帮助用户全方位了解相关信息。平台可无限扩展,用户可通过插件和智能助手扩展功能,满足各种需求。平...
-
大概是最全的开源大模型LLM盘点了吧!
LLM(Large Language Model, 大型语言模型 是指那些规模庞大、参数数量众多的深度神经网络模型,用于理解和生成自然语言文本。在自然语言处理(NLP)领域有着广泛的应用,因其强大的语言理解和生成能力,能够处理各种复杂的文本任务,包括但不...
-
Poe为AI机器人创建者引入了按消息定价的收入模式
AI 机器人创作者现在有了一种新的赚钱方式,Quora 旗下的 AI 聊天机器人平台 Poe 推出了一种收入模式,允许创作者为他们的机器人设置每条信息的价格,这样他们就可以在用户发送消息时赚钱。该公司于2023年10月推出了一个收入共享计划,为订阅 Poe...
-
12万合作伙伴,5倍增速!百度智能云交出了大模型时代最靓丽的成绩单!
4月9日,百度智能云Generate全球生态大会在中国最具幸福感的城市成都惊艳开启,现场秀出了作为支撑百度文心大模型基座的硬实力和生态肌肉。先说几个数字,一年时间,千帆大模型平台已经服务8.5万企业用户,累计帮助用户精调1.4万个大模型,帮助用户开发出1...
-
MagicTime官网体验入口 AI生成延时视频软件使用地址
MagicTime是一种基于文本描述生成高质量变化视频的模型。它通过学习时间流逝视频中的物理知识,实现了高度逼真的变化过程模拟。该模型包括MagicAdapter、Dynamic Frames Extraction和Magic Text-Encoder三个...
-
JAVA项目接入百度文心一言文本对话功能
依赖 <dependency> <groupId>com.squareup.okhttp3</groupId> <artifactId>okh...
-
Claude 3 横空出世,亚马逊云科技携手Anthropic引领企业级生成式 AI 新纪元
2024 年 3 月,OpenAI 的主要竞争对手之一 Anthropic 推出最新的 Claude 3 大语言模型系列:Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。自从 GPT-3.5 推出以来,业界对...
-
苹果新AI模型研究Ferret-UI:或将提升Siri,读懂屏幕内容
尽管苹果在生成式 AI 热潮开始后并未推出任何 AI 模型,但近期公司正在着手一些 AI 项目。上周,苹果研究人员分享了一篇揭示公司正在研发的新语言模型的论文,内部消息称苹果正在研发两款 AI 驱动的机器人。 如今,又一份研究论文的发布显示苹果才刚刚开始。...
-
利用人工智能对文本内容进行自动摘要
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 随着互联网上各种 UGC 越来越多,各种原创性的长文本内容也不断地涌现出来。例如,在人工智能领域的三大顶会之一的 ICML,许多论文...
-
半年融资1.6亿美金,AI学语言又来敲Duolingo的门了
在11月的选题《卷起来了,网易和谷歌都想抢Duolingo的生意》中,我们观察到了谷歌和网易等公司都基于 AI 开发了语言学习产品,市面上也充斥着同类产品。但测试后发现,AI 在语言学习产品中的作用主要在“练口语”这个层面,解决“开口难”问题,相比于 Du...
-
使用 MacBook Pro M1 16G 运行 Llama 2 7B (Apple Silicon 通用方法)
原文地址: 使用 MacBook Pro M1 16G 运行 Llama 2 7B (Apple Silicon 通用方法 这篇文章用于记录我在 MacBook Pro M1 16G 中配置 Llama 2 7B 环境的全流程。这一方法适用于所有 Ap...
-
阿里开源的32B大模型到底强在哪里?你知道吗?
阿里巴巴最近开源了一个320亿参数的大语言模型Qwen1.5-32B,网上都说很强很强,那么它到底强在哪里呢? 更高的性价比 Qwen1.5-32B中的B是billion的意思,也就是10亿,32B就代表320亿参数量。 阿里之前还开源过一个大模型Qwe...
-
Intel发布Gaudi 3 AI加速器:4倍性能提升、无惧1800亿参数大模型
快科技4月10日消息,美国当地时间4月9日,Intel举办了一场面向客户和合作伙伴的Intel Vision 2024产业创新大会,做出多项重磅宣布,包括全新的Gaudi 3 AI加速器,包括全新的至强6品牌,以及涵盖全新开放、可扩展系统,下一代产品和一系...
-
AI绘图cuda与stable diffusion安装部署始末与避坑
stable diffusion的安装说起来很讽刺,最难的不是stable diffusion,而是下载安装cuda。下来我就来分享一下我的安装过程,失败了好几次,几近放弃。 一、安装cuda 我们都知道cuda是显卡CPU工作的驱动(或者安装官网的...
-
【从零开始AI绘画2】StableDiffusionWebUI的基础使用
StableDiffusionWebUI的基础使用 第一章中已经完成了SDwebui的部署已经初始化,接下来我们开始基础使用,涉及更细节高级的功能本文暂时不写 文章目录 StableDiffusionWebUI的基础使用 界面简介...
-
基于Stable Diffusion的智能绘画大模型
随着人工智能技术的不断发展,AI艺术也在逐渐崭露头角。其中,基于Stable Diffusion的智能绘画大模型更是成为了AI艺术领域的一大亮点。那么,什么是Stable Diffusion?它又是如何应用于智能绘画大模型中的呢?本文将为您一一解答。 首...
-
Android Studio安装AI插件Github Copilot
步骤: 1.先点击filesetting 2.如下图点击,然后搜索Github Copilot,点击install下载 3。下载完成后会重启软件,如果没有自动重启要进去插件里点击重启软件 4.点击sign in to GitHub登录 注:如...
-
尝试着在Stable Diffusion里边使用SadTalker进行数字人制作
首先需要标明的是,我这里是图片说话类型,而且是看了知识星球AI破局俱乐部大航海数字人手册进行操作的。写下这篇文章是防止我以后遗忘。 我使用的基础软件是Stable Diffusion,SadTalker是作为插件放进来的,需要注意的是这对自己的电脑GPU要...