-
据报道,微软正在开发拥有5000亿个参数的MAI-1人工智能模型
据The Information近日报道,微软公司正在开发一个拥有约5000亿个参数的大型语言模型。 据悉,这个在微软内部被称为MAI-1的大型语言模型预计最早将于本月亮相。 OpenAI在2020年中期推出 GPT-3 时,详细说明了该模型的初始版...
-
使用LLMLingua-2压缩GPT-4和Claude提示
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 缩短发送给大型语言模型(LLM 的提示的长度可以减少推理时间并降低成本。这是提示压缩成为LLM研究的一个热门领域的原因。 清华大学和微...
-
LeCun转发,AI让失语者重新说话!纽约大学发布全新「神经-语音」解码器
脑机接口(BCI)在科研和应用领域的进展在近期屡屡获得广泛的关注,大家通常都对脑机接口的应用前景有着广泛的畅享。 比如,由于神经系统的缺陷造成的失语症不仅严重阻碍患者的日常生活,还可能限制他们的职业发展和社交活动。随着深度学习和脑机接口技术的迅猛发展,...
-
AI正在左右TikTok与Instagram观点?区块链或可解决问题
强大且易于使用的生成式AI正在快速崛起,并开始撼动社交媒体的基本格局。新的AI工具乃至AI影响者正在塑造我们通过TikTok及Instagram等平台开展交互的方式。这种影响不仅体现在内容的生成与传播方面,更对人类创作者构成了严峻的生存威胁。至于解决之...
-
挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队
不需要OpenAI,微软或许也会成为AI领头羊! 外媒Information爆料称,微软内部正在开发自家首款5000亿参数的大模型MAl-1。 这恰好是,纳德拉带领团队证明自己的时候到了。 在向OpenAI投资100多亿美元之后,微软才获得了GPT-3...
-
手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据
过去几年,借助Scaling Laws的魔力,预训练的数据集不断增大,使得大模型的参数量也可以越做越大,从五年前的数十亿参数已经成长到今天的万亿级,在各个自然语言处理任务上的性能也越来越好。 但Scaling Laws的魔法只能施加在「固定」的数据源上,...
-
报道称微软准备推新AI模型,内部代号MAI-1、约5000亿参数
据外媒the Information报道,微软正准备推出一种新的、内部 AI 语言模型。 新模型内部代号为 MAI-1,由最近加入微软的梅斯塔法・苏莱曼负责,他是谷歌 DeepMind 的联合创始人,也是人工智能初创公司 Inflection 的前 CEO...
-
关于人工智能,专家不愿透露的秘密!
如今,人工智能(AI 已经成为我们生活中不可分割的一部分。专家们通常会指出人工智能的优势,但可能不会很快提到这项技术的问题。本文将深入挖掘人工智能专家不愿意透露的隐藏秘密。 1.人工智能并非万无一失 虽然人工智能系统可以使数字更精确的许多倍,但并非完美...
-
特斯拉机器人进厂打工,马斯克:手的自由度今年将达到22个!
特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。 正常速度下,它分拣电池(特斯拉的4680电池)是这样的: 官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣: 这次放出的视频亮点之一在于Optimus在厂子里完成这项工作...
-
特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了
特斯拉人形机器人又解锁了新技能! 昨日,Tesla Optimus 官方发布了新的 demo 视频,展示了二代 Optimus 人形机器人的最新进展。 这次,Optimus 开始进厂打工了,在特斯拉电池工厂学会了分装电池,并且比以前走得更快更远更稳了。...
-
AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了
AI做数学题,真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在一些复杂任务上的表现也能大幅提升! 一作Jacab Pfau表示:只要花费算力生成额外token就能带来优势,具体选择了什么token无...
-
终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
当前最火的大模型,竟然三分之二都存在过拟合问题? 刚刚出炉的一项研究,让领域内的许多研究者有点意外。 提高大型语言模型的推理能力是当前研究的最重要方向之一,而在这类任务中,近期发布的很多小模型看起来表现不错,比如微软 Phi-3、Mistral 8x2...
-
专利大模型的实践与知识问答探索
一、专利大模型背景介绍 智慧芽一直致力于为科技创新和知识产权领域提供信息服务。在小型模型时代(如 Bert),参数量较少,智能理解方面存在局限性。因此,在着手开发大模型之前,智慧芽深入思考了领域聚焦的重要性。在知识产权领域,专利检索、专利对比、标引工作...
-
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
除了计算资源和训练数据这些硬实力外,Llama3模型开源的训练思路覆盖了LLM模型的全部生命周期,提供了各种开源生态系统下的工具。 Llama3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。 最近,M...
-
「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?
前段时间,微软搞了个乌龙:隆重地开源了 WizardLM-2,又在不久后撤回得干干净净。 据现在可以查到的 WizardLM-2 发布信息,这是一个「真正媲美 GPT-4」的开源大模型,在复杂聊天、多语言、推理和代理方面的性能得到了提高。 该系列包括三个...
-
开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型
开源大模型,已经开启大卷特卷模式。 全球范围,太平洋两岸,双雄格局正在呼之欲出。 Llama 3中杯大杯刚惊艳亮相,国内通义千问就直接开源千亿级参数模型Qwen1.5-110B,一把火上Hacker News榜首。 不仅相较于自家720亿参数模型性能明...
-
还在YOLO-World?DetCLIPv3出手!性能大幅度超出一众SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 现有的开词汇目标检测器通常需要用户预设一组类别,这大大限制了它们的应用场景。在本文中,作者介绍了DetCLIPv3,这是一种高性能检测器,不仅在开词汇目标检测方面表现出色,同时还能为检测到的目标生成...
-
OpenAI与英国金融时报签署合作协议,为ChatGPT提供许可内容
OpenAI 近日宣布与英国知名新闻日报《金融时报》签署战略合作伙伴关系,旨在扩大 ChatGPT 上可用的新闻内容。根据协议,ChatGPT 将以相应查询方式呈现《金融时报》的文章,并附上必要的摘要、引述和链接。双方在一份新闻稿中指出,所有来自《金融时报...
-
报道称,苹果App Store下架三款AI脱衣软件
据404Media报道,苹果已经从 App Store 中移除了三款被宣传为 “艺术生成器” 的应用程序,这些应用在 Instagram 和成人网站上宣传自己可以 “免费脱掉任何女孩的衣服”。 这些应用利用人工智能生成虚假的裸体图像,虽然图像并不显示实际...
-
通过学习曲线识别过拟合和欠拟合
本文将介绍如何通过学习曲线来有效识别机器学习模型中的过拟合和欠拟合。 欠拟合和过拟合 1、过拟合 如果一个模型对数据进行了过度训练,以至于它从中学习了噪声,那么这个模型就被称为过拟合。过拟合模型非常完美地学习了每一个例子,所以它会错误地分类一个看不见的...
-
超级智能体生命力觉醒!可自我更新的AI来了,妈妈再也不用担心数据瓶颈难题
哭死啊,全球狂炼大模型,一互联网的数据不够用,根本不够用。 训练模型搞得跟《饥饿游戏》似的,全球AI研究者,都在苦恼怎么才能喂饱这群数据大胃王。 尤其在多模态任务中,这一问题尤为突出。 一筹莫展之际,来自人大系的初创团队,用自家的新模型,率先在国内把“模...
-
OpenAI 对手xAI即将融资60亿美元 估值180亿美元
据techcrunch报道,一位了解该交易的可信消息人士透露,xAI 是埃隆·马斯克 (Elon Musk) 成立10个月以来人工智能巨头 OpenAI 的竞争对手,即将完成融资60亿美元,投前估值为180亿美元。除非交易条款发生变化,否则这笔交易将让投资...
-
一文解决任何机器学习问题!
前言 数据挖掘大神Abhishek Thakur,很多数据挖掘kaggler对他都非常熟悉,他在 Linkedin 发表了一篇名为Approaching (Almost Any Machine Learning Problem(几乎解决任何机器学习...
-
如何在工业自动化中有效应用生成式AI?
围绕 ChatGPT、Bard、Bing Chat 和其他生成式人工智能(AI)工具的炒作正在增加。AI工具推广者的承诺是,未经培训的用户可以使用这些工具来创建书面内容、计算机代码甚至法律文件。工业生成式AI战略应该包括具有自动化或应用专业知识(或两者兼...
-
一次性讲明白,如何搞定一个可以支持多芯混合训练的 AI 集群
由于外部环境的变化,适用于大模型训练任务的 GPU 整体规模无法继续增长。这些存量 GPU 组成的集群,仍然是当前加速大模型训练的主要 AI 算力来源。同时,各类国产 AI 芯片开始大规模投入实际生产任务。在未来一段时间内,数据中心的 AI 算力将保持多...
-
模糊图像重建重大进展!DeblurGS:相机位姿不准也能极致渲染!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 尽管在从运动模糊图像中重建清晰的3D场景方面取得了重大进展,但向现实世界应用的过渡仍然具有挑战性。主要障碍源于严重的模糊,这导致通过“Structure-from-M...
-
OpenAI Preparedness团队首席Aleksander Madry:机器学习模型的内部计算如何将输入转化为预测?
考虑一个标准的ResNet50模型,该模型经过训练用于图像分类任务。我们是否能够理解这个模型中的卷积滤波器如何将输入图像转换为其预测的标签?或者,GPT-3中的注意力头如何contribute到下一个标记的预测?理解这些模型组件——包括滤波器或头等架构...
-
LLM 安全 | 大语言模型应用安全入门
一、背景 2023年以来,LLM 变成了相当炙手可热的话题,以 ChatGPT 为代表的 LLM 的出现,让人们看到了无限的可能性。ChatGPT能写作,能翻译,能创作诗歌和故事,甚至能一定程度上做一些高度专业化的工作,比如法律服务和医疗诊断咨询。...
-
股价飙升!商汤大模型挑战GPT4
4月24日,商汤集团在港交所暂停交易前股价上涨31.15%。商汤集团表示,其大模型日日新5.0发布会受到市场极大关注,公司将进一步刊发相关公告。在“2024年商汤技术交流日”上,商汤发布了其最新的大模型——SenseNova5.0,旨在追赶GPT-4,这反...
-
苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相
要说 ChatGPT 拉开了大模型竞赛的序幕,那么 Meta 开源 Llama 系列模型则掀起了开源领域的热潮。在这当中,苹果似乎掀起的水花不是很大。 不过,苹果最新放出的论文,我们看到其在开源领域做出的贡献。 近日,苹果发布了 OpenELM,共四种变...
-
微软3.8B模型媲美GPT-3.5!小到用iPhone就能跑起来,网友:Good data is all you need!
撰文、整理 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 这周,“小模型”之战打得可谓精彩非凡,让人目不暇接。前脚,小扎刚在采访中自豪地宣布Llama3 80亿模型几乎与此前Llama2 700亿模型的性能差不多...
-
防止AI系统受到提示注入攻击的五个方法
译者 | 布加迪 审校 | 重楼 提示注入攻击是一种网络安全威胁,专门针对基于人工智能(AI)的系统,包括聊天机器人、虚拟助理及其他基于AI的界面。当攻击者以某种方式操纵AI模型的输入,导致模型执行意外操作或泄露敏感信息时,就会发生这类攻击。这种操纵可以...
-
微软推出iPhone能跑的ChatGPT级模型,网友:OpenAI得把GPT-3.5淘汰了
Llama 3发布刚几天,微软就出手截胡了? 刚刚发布的Phi-3系列小模型技术报告,引起AI圈热议。 其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。 为了方便开源社区使用,还特意设计成了与Llama系列兼容的结...
-
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试
上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。 有网友突然发现,WizardLM的模型权重、公告帖子全部被删除,并且不再微软集合中,除了提到站点之外,却找不到任何证据证明这个微软的官方项目。...
-
微软发布iPhone可运行的ChatGPT级AI模型Phi-3系列 挑战OpenAI地位
近日,微软推出了一款名为Phi-3系列的小型AI模型,该模型在AI领域引起了广泛关注。Phi-3系列中的Phi-3-mini模型,仅拥有3.8B参数,却在多项基准测试中超越了拥有8B参数的Llama3模型。 微软特别强调,经过4bit量化处理的Phi-3-...
-
一文了解大语言模型(LLM)
人工智能的发展给我们的生活带来很多不一样的体验。面部识别可以解锁设备,激光雷达可以实现自动驾驶。当2023年,OpenApi的chatGPT可以“理解”人类的语言并与我们进行沟通时,大语言模型的概念出现在我们面前。 在自然语言处理领域的大语言模型(La...
-
ChatGPT能预测未来特定事件,准确率高达97%
贝勒大学经济学院的Pham Hoang Van和Scott Cunningham两位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。 研究人员使用了直接预测和未来叙述(Future Narrative)两种提示方法,进行...
-
牛津大学最新!Mickey:3D中的2D图像匹配SOTA!(CVPR'24)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面 项目链接:https://nianticlabs.github.io/mickey/ 给定两张图像,可以通过建立图像间的对应关系来估计它们之间的相机相对姿态。通常,这些对应关系是二维到二维的...
-
集体智慧:LLM预测能力与人群可相互媲美
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 现在,AI系统的预测准确率达到甚至超过了人群。 在不断发展的人工智能(AI)领域,语言模型已取得了重大进展,实现了曾经被认为人类认知...
-
预测性人工智能将如何帮助实现净零排放
预测性人工智能是生成式人工智能 (AI 的表亲,其使用历史数据中的模式来预测未来结果或对未来事件进行分类,有专家表示,该技术可用于提供可操作的见解并辅助决策和战略制定。 在过去一年左右的时间里,我们看到能源行业出现了许多新的、令人兴奋的预测性人工智...
-
小即是大?HuggingFace CEO预测小模型元年将至,将成为AI的下一个“大事件”
编译 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 在人工智能领域的竞争中,科技巨头们一直在竞相构建越来越大的语言模型。Scaling Law 信仰随着模型规模的增加,其性能会指数提升,展现出更好的泛化能力,甚至在某些情况下展现出“...
-
微软紧急撤回最先进的AI大模型:居然忘了测试了
快科技4月21日消息,Meta发布超级彪悍的大语言模型Llama 3之后,微软也很快推出了自己的新一代WizardLM2 8x22B,号称迄今最强大,完全超越Claude 3 OpusSonnet、GPT-4等竞品,而且开源,但是马上又把它撤回去了。 没有...
-
微软推出新型AI工具VASA-1:可将照片转化为视频
快科技4月21日消息,据媒体报道,微软亚洲研究院近期推出了一款革命性的人工智能工具VASA-1,这一工具的推出引起了业界和公众的广泛关注。 VASA-1的独特之处在于,它能够将静态图像或绘画与音频文件结合,生成具有动态面部表情和头部动作的面孔。这意味着,仅...
-
引人注意的十大由AI造成的灾难案例
2017年,《经济学人》宣称数据已取代石油成为世界上最有价值的资源,这一说法自此一直被重复。跨越各个行业的企业一直在投资数据和分析,并将持续大举投资,但就像石油一样,数据和分析也有其阴暗面。 根据《CIO》杂志2023年的《CIO状态报告》,26%的I...
-
Llama3突然来袭!开源社区再次沸腾:GPT4级模型自由访问时代到来
Llama 3来了! 就在刚刚,Meta官网上新,官宣了Llama 3 80亿和700亿参数版本。 并且推出即为开源SOTA: Meta官方数据显示,Llama 3 8B和70B版本在各自参数规模上超越一众对手。 8B模型在MMLU、GPQA、Huma...
-
六种方式快速体验最新发布的 Llama 3!
昨晚, Meta 发布了 Llama 3 8B 和 70B 模型,Llama 3 指令调整模型针对对话/聊天用例进行了微调和优化,在常见基准测试中优于许多现有的开源聊天模型。比如,Gemma 7B 和 Mistral 7B。 Llama 3 模型将...
-
全球首个「开源GPT-4」出世!Llama 3震撼发布,Meta AI免登录可用
LLM界的「真·Open AI」,又来整顿AI圈了! 业内惊呼:首个开源GPT-4级的模型,终于来了!开源模型追上闭源模型的历史性一刻,或许就在眼前了? 一石激起千层浪,Llama3才刚刚发布没几小时,就破纪录地登顶了Hugging Face排行榜。 这...
-
Meta 发布Llama 3,能力直逼GPT-4,一己之力拉高开源大模型水位
编辑|伊风、诺亚 出品 | 51CTO技术栈(微信号:blog51cto) Meta麾下“羊驼”一路狂奔在开源的大道上。 在过去的一年里,Llama系列可以说开辟了开源LLM的半壁江山。 嫌弃开源模型能力只有GPT-3.5,不够用? 如今Llam...
-
开源大模型Llama 3王者归来!最大底牌4000亿参数,性能直逼GPT-4
扎克伯格:「有了 Llama3,全世界就能拥有最智能的 AI。」 ChatGPT 拉开了大模型竞赛的序幕,Meta 似乎要后来居上了。 本周四,AI 领域迎来重大消息,Meta 正式发布了人们等待已久的开源大模型 Llama3。 扎克伯格在 Faceboo...
-
通透!机器学习各大模型原理的深度剖析!
通俗来说,机器学习模型就是一种数学函数,它能够将输入数据映射到预测输出。更具体地说,机器学习模型就是一种通过学习训练数据,来调整模型参数,以最小化预测输出与真实标签之间的误差的数学函数。 机器学习中的模型有很多种,例如逻辑回归模型、决策树模型、支持向量...