-
Llama 3每秒输出800个token逼宫openAI!下周奥特曼生日或放出GPT-5?
【新智元导读】Llama3的开源,或将催生数十亿美元新产业。发布不到一周的时间,全网各种测试微调都开启了。甚至,Llama3在Groq上的输出速度实现了每秒800个token。 Llama3诞生之后便艳压群雄,开源界已无「模」能敌。 甚至,让网友为Open...
-
清华全球大模型报告出炉,文心一言语文数学双料第一
最近,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0表现亮眼,与国际...
-
综述!深度模型融合(LLM/基础模型/联邦学习/微调等)
23年9月国防科大、京东和北理工的论文“Deep Model Fusion: A Survey”。 深度模型融合/合并是一种新兴技术,它将多个深度学习模型的参数或预测合并为一个模型。它结合了不同模型的能力来弥补单个模型的偏差和错误,以获得更好的性能。然而...
-
从文字模型到世界模型!Meta新研究让AI Agent理解物理世界
LLM已经可以理解文本和图片了,也能够根据它们的历史知识回答各种问题,但它们或许对周围世界当前发生的事情一无所知。 现在LLMs也开始逐步学习理解3D物理空间,通过增强LLMs的「看到」世界的能力,人们可以开发新的应用,在更多场景去获取LLMs的帮助。...
-
Llama3突然来袭!开源社区再次沸腾:GPT4级模型自由访问时代到来
Llama 3来了! 就在刚刚,Meta官网上新,官宣了Llama 3 80亿和700亿参数版本。 并且推出即为开源SOTA: Meta官方数据显示,Llama 3 8B和70B版本在各自参数规模上超越一众对手。 8B模型在MMLU、GPQA、Huma...
-
Stability AI宣布裁员20人,约占员工总数的10%
英国 AI 公司Stability AI 宣布裁员20人,占其员工总数的约10%。此前一天,该公司刚刚宣布扩大其旗舰模型的使用范围。 这一裁员决定是在其创始 CEO 离职后的动荡几周之后做出的。据 CNBC 报道,这家总部位于英国的 AI 公司运行着稳定扩...
-
2024谷歌研究学者计划名单公布:清华、北大、上交ACM班等校友在列
2024 年谷歌研究学者计划(Research Scholar Program)获奖名单公布了。获奖者最高将获得 6 万美元奖金,用于支持研究工作。 今年该计划共涉及 12 个领域,包括算法与优化;应用科学;人机交互;健康研究;机器学习和数据挖掘;机器感...
-
1个基础模型系列、3大 AI 开发工具,Create 2024重磅发布都在这里了!
4月16日,百度举办了 Create 2024百度 AI 开发者大会,包括百度创始人、董事长兼首席执行官李彦宏在内的多位重磅嘉宾登台演讲,并与全球各地的开发者们分享了百度在 AI 领域的最新技术进展。 人人都是开发者 百度创始人、董事长兼首席执...
-
Anthropic Claude 3 Opus基础模型在Amazon Bedrock上正式可用
北京——2024年4月17日 亚马逊云科技宣布,在Amazon Bedrock上正式推出来自Anthropic的Claude 3 Opus模型,该模型是Claude 3家族中最智能的模型,在高度复杂的任务上表现卓越,并拥有惊人的流畅性和类似人类的理解能力...
-
李彦宏内部讲话谈大模型:闭源才有真正的商业模式
4月11日,一则关于大模型的李彦宏内部讲话流出。在讲话中李彦宏对大模型的开源闭源路线之争给出了自己的解答。 他说,市场上已经有足够多的开源大模型,“不缺我们这一家开源的模型。我们要开源还得自己去维护一套开源的版本,这是不划算的。” 他还表示,闭源模型...
-
新加坡国立大学 | 通过语言分割任何3D目标
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文研究了具有自由形式语言指令的开放词汇3D实例分割(OV-3DIS)。先前的作品只依赖于注释的基本类别进行训练,对看不见的长尾类别的泛化能力有限。最近的工作通过生成类...
-
从AIGC到AGI,为什么我们需要更多的“技术信仰派”?
整理 | 伊风 采访 | 张晓楠 嘉宾 | 巴川、朱雷、肖然 出品 | 51CTO技术栈(微信号:blog51cto) 作为AIGC应用落地元年,2024开年就抛给我们一些不太好回答的问题: 在以探索AGI为长期目标时,我们该坚守技术信仰吗? 除了复制...
-
多个SOTA !OV-Uni3DETR:提高3D检测在类别、场景和模态之间的普遍性(清华&港大)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 这篇论文聚焦于3D目标检测的领域,特别是Open-Vocabulary的3D目标检测。在传统的3D目标检测任务中,系统旨在预测真实场景中物体的定向3D边界框和语义类别标签,这通常依赖于点云或RGB图像...
-
谷歌向微软英特尔全面宣战:首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨晚的Google Cloud Next2024大会上,谷歌接连放出一堆模型和产品王炸:Gemini1.5Pro公开可用、上线音频处理能力;代码模型CodeGemma上新,首款自研Arm处理器Axion正式向微软和亚马逊宣战……这次,谷歌要以量取胜。 昨天...
-
CodeGemma官网体验入口 谷歌AI代码生成辅助工具使用地址
CodeGemma是谷歌公司推出的先进大语言模型,专注于生成代码、理解和追踪指令,旨在为全球开发人员提供高质量的代码辅助工具。包括 20 亿参数的基础模型, 70 亿参数的基础模型和用于指导追踪的 70 亿参数模型,针对代码开发场景进行优化和微调。在各种编...
-
神仙掐架!24届视觉算法岗(AIGC方向)秋招经验分享!
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学,针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 今天我来介绍我们星球社群一位很...
-
每周AI新闻(2024年第11周)Meta公布Llama 3集群细节 | Sora将于年内推出 | 全球首个AI软件工程师发布
这里是陌小北,一个正在研究硅基生命的碳基生命。正在努力成为写代码的里面背诗最多的,背诗的里面最会写段子的,写段子的里面代码写得最好的…厨子。 每周日解读每周AI大事件。 欢迎关注同名公众号【陌北有棵树】,关注AI最新技术与资讯。 大厂动向 M...
-
谷歌向微软英特尔全面宣战!首款自研Arm CPU,最强大模型公测,AI视频对垒Sora
昨天的谷歌Next大会可是太精彩了,谷歌一连放出不少炸弹。 - 升级「视频版」Imagen 2.0,下场AI视频模型大混战 - 发布时被Sora光环掩盖的Gemini 1.5 Pro,正式开放 - 首款Arm架构CPU发布,全面对垒微软/亚马逊/英伟达/...
-
刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁
【新智元导读】初创团队Mistral AI再次放出一条磁力链,281GB文件解禁了最新的8x22B MoE模型。 一条磁力链,Mistral AI又来闷声不响搞事情。 281.24GB文件中,竟是全新8x22B MOE模型! 全新MoE模型共有56层,...
-
120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B
继16亿轻量级Stable LM 2推出之后,12B参数的版本在今天亮相了。 见状,不少网友纷纷喊话:干的漂亮!但,Stable Diffusion 3啥时候出啊? 总得来说,Stable LM 2 12B参数更多,性能更强。 120亿参数版本包含了...
-
百度智能云发布千帆大模型一体机:预置十余个主流开源大模型
快科技4月9日消息,据媒体报道,在百度智能云GENERATE全球生态大会上,百度智能云发布千帆大模型一体机,从算力资源角度分为通用版、昇腾版、昆仑芯版三个版本,为企业私有化部署大模型提供解决方案。 据介绍,千帆大模型一体机预置了百度自研的文心大模型,以及L...
-
Fireworks.ai开源API使任何开发者都能使用生成式AI
随着人们对生成式 AI 的热情不断高涨,越来越多的公司试图涉足这一领域。Fireworks.ai 就是其中之一。虽然公司名气不及 OpenAI、Anthropic 和 Cohere 等大牌厂商,但据该公司称,它拥有超过12,000名用户的最大开源模型 AP...
-
大模型融合!最新「进化算法」全自动组合开源模型,刷榜多项基准测试
人类智慧的基础并不在于单个聪明的个体,而在于集体智慧。 比如说,我们的社会和经济体系就是建立在由具有不同专业和专长的不同个人组成的许多机构的基础上的。 Sakana AI团队相信,人工智能的发展也将遵循类似的集体道路。 人工智能的未来不会是一个单一的、巨...
-
AI公司出门问问通过港交所聆讯 有望成为AIGC第一股
据IPO早知道报道,“出门问问”日前成功通过港交所聆讯,并于4月2日公布了相关资料,旨在主板挂牌上市。本次上市由中金公司和招银国际共同担任联席保荐人,此举标志着出门问问或将引领AIGC行业,成为该领域的“第一股”。 据悉,出门问问是一家人工智能公司,专注于...
-
Ai绘画 | Stable Diffusion常用大模型介绍
哈喽,大家好。 今天给大家分享一下Stable Diffusion中我常用的大模型,主要内容包含它们的流行程度和绘画风格。 还没安装Stable Diffusion的小伙伴可以看一下我往期发布的Stable DIffusion安装教程 注意:大模型存...
-
『SD』零基础快速搭建Stable Diffusion(Windows版)
theme: smartblue 点赞 + 关注 + 收藏 = 学会了 本文简介 本文介绍如何在 Windows 安装 Stable Diffusion WebUI,不需要懂代码,只要跟着本文一步步操作就能在你电脑用AI绘画了。 只...
-
什么是生成式AI?有哪些特征类型
生成式AI是人类一种人工智能技术,可以生成各种类型的内容,包括文本、图像、音频和合成数据。那么什么是人工智能?人工智能和机器学习之间的区别是什么?有哪些技术特征? 人工智能是一门学科,是计算机科学的一个分支,研究智能代理的创建,这些智能代理是可以推理、...
-
Harvey公司与OpenAI合作 为法律专业人士打造定制训练的案例法模型
近日,Harvey公司与OpenAI宣布合作,共同为法律专业人士打造了一款定制训练的案例法模型。这款AI系统不仅具备复杂的推理能力,还能够处理广泛的法律领域知识,并具备超越单一模型调用的能力。 它能够起草法律文件、回答复杂的诉讼场景问题,甚至识别数百份合同...
-
开源!超越ZoeDepth! DepthFM:快速且精确的单目深度估计!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 0. 这篇文章干了啥? 提出了DepthFM:一个多功能且快速的最先进的生成式单目深度估计模型。除了传统的深度估计任务外,DepthFM还展示了在深度修复等下游任务中的最先进能力。DepthFM效率高...
-
Stable Diffusion下载安装,保姆级教程指南!
一、了解Stable Diffusion 1、Stable Diffusion(简称SD)是一种图像生成模型,主要用于生成以文本生成图像,图片生成图片,图片修复等,由慕尼黑路德维希马克西米利安大学CompVis 小组和Runway的研究人员提出,由...
-
叠衣服、擦案板、冲果汁,能做家务的国产机器人终于要来了
将家务全部交给机器人的那一天,或许会比想象中更快到来。 还记得会炒菜的斯坦福 ALOHA 机器人吗?现在,中国的初创公司自变量机器人(X Square)展示了同样令人惊艳的能力,甚至更进一步。 在该公司最新展示的 Demo 中,完全基于大模型自主推理的...
-
MuseV官网体验入口 虚拟人AI视频生成软件使用地址
MuseV是一个基于扩散模型的虚拟人视频生成框架,支持无限长度视频生成,采用了新颖的视觉条件并行去噪方案。它提供了预训练的虚拟人视频生成模型,支持Image2Video、Text2Image2Video、Video2Video等功能,兼容Stable Di...
-
快速理解AIGC图像控制利器ControlNet和Lora的架构原理
作者公众号 大数据与AI杂谈 (TalkCheap),转载请标明出处 ControlNet以及Lora是什么,玩过stable diffusion AI图像生成的同学应该都不陌生。 一般来说,如果你用以SD 或 SDXL为基础的模型来生成图像,产出的图...
-
0门槛免费商用!孟子3-13B大模型正式开源,万亿token数据训练
澜舟科技官宣:孟子3-13B大模型正式开源! 这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。 在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。 尤其在参数量20B以内的轻量化大模...
-
Code Llama 简介,一种最先进的大型编码语言模型
Code Llama 简介,一种最先进的大型编码语言模型 2023 年 8 月 24 日...
-
Stable Diffusion——Animate Diff一键AI图像转视频
前言 AnimateDiff 是一个实用框架,可以对文本生成图像模型进行动画处理,无需进行特定模型调整,即可为大多数现有的个性化文本转图像模型提供动画化能力。而Animatediff 已更新至 2.0 版本和3.0两个版本,相较于 1.0 版本,2.0...
-
Stable Diffusion Webui 本地部署【踩坑记录】
1、安装python Python Release Python 3.10.6 | Python.org 2、安装git git是一个代码管理工具,通过它可以将开源项目仓库克隆到本地 下载地址:Git - Downloading Package...
-
生成式AI为什么受到各行业追捧?
生成式AI是人类一种人工智能技术,可以生成各种类型的内容,包括文本、图像、音频和合成数据。那么什么是人工智能?人工智能和机器学习之间的区别是什么? 人工智能是一门学科,是计算机科学的一个分支,研究智能代理的创建,这些智能代理是可以推理、学习和自主行动的...
-
EVI人工智能对话AI使用地址入口 Hume.AI官网体验入口
Hume.AI是一项专注于开发能够理解人类情感和表情的技术的人工智能产品。它提供了表情测量API和自定义模型API,以预测和改善人类福祉。这款工具适用于需要理解和预测人类情感、行为和福祉的研究人员、开发者和企业。 点击前往Hume.AI官网体验入口 谁可...
-
Hume AI EVI对话人工智能体验入口 情感大语言模型eLLM使用地址
Hume.AI专注于开发能够理解人类情感和表情的技术,提供表情测量API和自定义模型API,以预测和改善人类福祉。近日发布的EVI是一款具有情感感知能力的对话AI,采用了情感大语言模型(eLLM)技术。 点击前往Hume.AI EVI体验入口 谁可以从H...
-
大型语言模型如何教会自己遵循人类指令?
译者 | 李睿 审校 | 重楼 如今,人们对能够使大型语言模型(LLM 在很少或没有人为干预的情况下改进功能的技术越来越感兴趣。大型语言模型(LLM 自我改进的领域之一是指令微调(IFT ,也就是让大型语言模型教会自己遵循人类指令。 指令微调(IFT ...
-
开源大模型DBRX:1320亿参数,比Llama2-70B快1倍
大数据公司Databricks最近发布了一款名为DBRX的MoE大模型,引发了开源社区的热议。DBRX在基准测试中击败了Grok-1、Mixtral等开源模型,成为了新的开源之王。这款模型的总参数量达到了1320亿,但每次激活只有360亿参数,并且其生成速...
-
Claude 3再次登顶!化学专业一骑绝尘,全面碾压GPT-4
Claude 3的诞生又一次震惊了全世界。 Claude 3 Opus,Claude 3中最智能的模型,在大多数常见的人工智能系统评估基准测试中表现优异,包括本科水平专家知识(MMLU)、研究生水平专家推理(GPQA)、基础数学(GSM8K)等。 图片...
-
新开源之王来了!1320亿参数,逻辑数理全面打赢Grok,还比Llama2-70B快1倍
“最强”开源大模型之争,又有新王入局: 大数据巨头Databricks,刚刚发布MoE大模型DBRX,并宣称: 它在基准测试中击败了此前所有开源模型。 包括同为混合专家模型的Grok-1和Mixtral。 新王搅局,迅速引发了开源社区的热议。 毕竟,仅...
-
AIGC工具-Stable Diffusion安装指南
Stable Diffusion Web UI安装教程 简介 这是一款ai学习的作图模型训练,github的官网地址是https://github.com/AUTOMATIC1111/stable-diffusion-webui 参考上面的gi...
-
中国工程院院士唐志共:AI破解传统气动外形设计难题 实现高效多样化创新
3月25日消息(赵婷婷)日前,在“昇思人工智能框架峰会2024”上,中国科学院院士、中国空气动力学会理事长唐志共表示,近年来,随着人工智能技术的高速发展,人工智能与科学计算的融合不断迸发出新的火花,形成AI的新范式。这种范式以物理驱动、物理+数据融...
-
新研究:大语言模型“涌现”能力不令人惊讶也不难预测
3月26日消息,一项新的研究认为,大语言模型性能的显著提升并不令人意外,也并非无法预测,实际上这是由我们衡量人工智能性能的方式所决定的。 两年前,450位研究人员在一个名为超越模仿游戏基准(Beyond the Imitation Game Bench...
-
利用MindsDB和Anyscale微调Mistral 7B模型
在我们为面向客户的聊天应用制作大语言模型 (LLM 时,预训练模型往往是很好的起点,但随着时间的推移,您可能希望去控制该模型聊天的整体行为和给客户带去的“感觉”,而不仅仅由基本模型所能提供。对此,我们虽然可以通过提示工程(prompt engineeri...
-
3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑
在最近的研究中,视觉-语言-动作(VLA,vision-language-action)模型的输入基本都是2D数据,没有集成更通用的3D物理世界。 此外,现有的模型通过学习「感知到动作的直接映射」来进行动作预测,忽略了世界的动态性,以及动作和动态之间的关...
-
微软获得Inflection大模型使用权及大部分员工
据内部消息透露,微软斥资约6.5亿美元,与人工智能初创企业Inflection AI达成一项重磅协议。根据该协议,微软不仅将获得Inflection的核心大模型使用权,更将吸纳其大部分员工,包括联合创始人,为微软注入新的活力。 据悉,Inflectio...