-
AI 框架Ambient Diffusion:从图像中获取灵感,而非复制
强大的人工智能模型有时会出现错误,包括虚构错误信息或将他人作品作为自己的。为了解决后者的问题,德克萨斯大学奥斯汀分校的研究团队开发了一种名为 "Ambient Diffusion" 的框架。该框架通过对无法辨认的图像数据进行训练,绕过了 AI 模型复制他人...
-
一文带您了解SHAP:机器学习的模型解释
在机器学习和数据科学领域,模型的可解释性一直是研究者和实践者关注的焦点。随着深度学习和集成方法等复杂模型的广泛应用,理解模型的决策过程变得尤为重要。可解释人工智能(Explainable AI ,XAI)通过提高模型的透明度,帮助建立对机器学习模型的信任...
-
蚂蚁多模态团队在视频多模态方向的技术探索
一、概述 视频多模态检索在蚂蚁内部有着广泛的应用。视频多模态检索具体包括两个方向,一个是视频-文本的语义检索,另外一个是视频-视频的同源检索。 视频-文本的语义检索方向旨在通过文本检索与其语义相近的视频,其检索文本未必在检索到的视频描述中直接出现,但检...
-
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
GPT-4o的横空出世,再次创立了一个多模态模型发展的新范式! 为什么这么说? OpenAI将其称为「首个『原生』多模态」模型,意味着GPT-4o与以往所有的模型,都不尽相同。 传统的多模态基础模型,通常为每种模态采用特定的「编码器」或「解码器」,将不...
-
HuggingFace教你怎样做出SOTA视觉模型
前有OpenAI的GPT-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。 其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。 刚好在这时,HuggingFace和法国索邦大学的一篇论文,总结出了构建视觉大模型的关键经验,给开发者指明了一...
-
Ilya离职后第一个动作:点赞了这篇论文,网友抢着传看
自Ilya Sutskever官宣离职OpenAI后,他的下一步动作成了大家关注焦点。 甚至有人密切关注着他的一举一动。 这不,Ilya前脚刚刚点赞❤️了一篇新论文—— ——网友们后脚就抢着都看上了: 论文来自MIT,作者提出了一个假说,用一句话总结...
-
70B模型秒出1000token,代码重写超越GPT-4o,来自OpenAI投资的代码神器Cursor团队
70B模型,秒出1000token,换算成字符接近4000! 研究人员将Llama3进行了微调并引入加速算法,和原生版本相比,速度足足快出了快了13倍! 不仅是快,在代码重写任务上的表现甚至超越了GPT-4o。 这项成果,来自爆火的AI编程神器Curso...
-
OpenAI联合创始人:GPT-4性能在 “有限的数据量” 下面临挑战
OpenAI 的联合创始人 John Schulman 近在 Dwarkesh Patel 的播客节目中分享了他对 GPT-4性能的见解,并提到了由于有限的练数据而可能面临的挑战。Schulman 在2022年11月 ChatGPT 的推出中扮演了重要角色...
-
红帽用RHEL AI和OpenShift AI塑造开源AI的未来
发展至今,AI技术对工作方式、决策过程乃至商业模式的重塑已经逐渐具象化。 红帽,作为开源解决方案的领军企业,在近日的在Red Hat Summit上,红帽展示了从RHEL AI的推出到InstructLab模型对齐工具的集成,再到OpenShift AI...
-
使用开源GenAI时需要注意的十个问题
如今似乎任何人都可以制作AI模型。即使你没有训练数据或编程技巧,你也可以选择你喜欢的开源模型,对其进行调整,并以新的名字发布。 根据斯坦福大学在4月发布的AI指数报告,2023年发布了149个基础模型,其中三分之二是开源的,而且有大量的变体。Huggi...
-
微软发布 MatterSim 模型:模拟材料、预测性能,AI 探索材料设计的无限可能
5 月 15 日消息,微软研究院科学智能中心(Microsoft Research AI for Science)近日推出 MatterSim 模型,能够在广泛的元素、温度和压力范围内,准确高效地模拟材料和预测性能,助力材料设计的数字化转型。 新材料探索...
-
谷歌CEO:如果OpenAI在AI训练中滥用YouTube将采取行动
谷歌母公司 Alphabet 的 CEO Sundar Pichai 在接受 BC 采访时表示,如果谷歌发现由微软支持的 OpenAI 利用 YouTube 内容来训练能够生成视频的人工智模型,谷歌将采取行动来解决这个问题。 这一表态是在 OpenAI 技...
-
MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文对自动驾驶领域内多模态大型语言模型(MLLMs)的应用进行了审慎的审视,并对一些常见的假设提出了质疑/验证,重点关注它们通过闭环控制环境中的图像/帧序列推理和解释...
-
为什么腾讯认为DiT架构是未来的主流?做了哪些改进?
OpenAI迭代ChatGPT的过程,发现随着参数量的提升,基于Transformer 架构的大语言模型出现了涌现现象。因此,在文生图领域,很可能参数量更大的模型,也会更“聪明”。 而此前文生图领域大火的Unet 模型容易陷入性能瓶颈与可扩展性的问题,且...
-
西浦、利物浦大学提出:点云数据增强首个全面综述
本论文的第一作者朱钦峰是西交利物浦大学和利物浦大学联合培养的一年级在读博士,其导师为范磊副教授。他的主要研究方向为语义分割、多模态信息融合、3D视觉、高光谱图像和数据增强。 本文是对发表于模式识别领域顶刊Pattern Recognition 2024的...
-
被追问Sora是否使用YouTube数据,OpenAI高管又语塞了
OpenAI 的另一位高管在被问及 Sora 视频生成器是否使用了 YouTube 数据时,同样陷入了困境。在最近举行的 Bloomberg 科技峰会上,OpenAI 席运营官 Brad Lightcap 在回答记者 Shirin Ghaffary 的问题...
-
思维链不存在了?纽约大学最新研究:推理步骤可省略
红极一时的思维链技术,可能要被推翻了! 还在惊讶于大模型居然能够利用思维链分步骤思考? 还在苦于不会写思维链提示词? 来自纽约大学的研究人员表示:「没关系的,都一样」, 推理步骤不重要,不想写提示词也可以不写,用省略号代替就行了。 论文地址:https...
-
OPPO 下一代大数据 AI 一体架构实践
一、技术架构 OPPO 大数据场景丰富,拥有海外的 AWS 功能云,国内自建机房,机器规模超过万台,在印度则是使用混合云模式。 首先来介绍一下 AWS 上功能云 EMR 的实践。 1. 云原生计算架构 OPPO 早期全部采用 EMR,其存在以下一些问题...
-
网友缝合Llama3 120B竟意外能打,轻松击败GPT2-chatbot和GPT-4
Llama 3首发阵容里没有的120B型号竟意外“曝光”,而且十分能打?! 最近这样一个号称是「Llama3-120b」的神秘大模型火了起来,原因在于它表现太出色了—— 轻松击败GPT-4、gpt2-chatbot那种。 比如,面对像「观察希格斯场是否会...
-
美国教授用2岁女儿训AI模型登Science!人类幼崽头戴相机训练全新AI
【新智元导读】为训练AI模型,纽约州立大学的一名教授Brenden Lake,竟让自己不到2岁女儿头戴相机收集数据!要知道,Meta训Llama3直接用了15万亿个token,如果Lake真能让AI模型学习人类幼崽,从有限的输入中学习,那LLM的全球数据荒...
-
Fine-Tuning Vs RAG ,该如何选择?
Hello folks,我是 Luga,今天我们来聊一下人工智能(AI 生态领域相关的技术 - LLM 构建块:向量、令牌和嵌入 。 随着技术的不断进步,LLM 带来了前所未有的机遇,吸引了开发者和组织纷纷尝试利用其强大的能力构建应用程序。然而,当预训...
-
大神Karpathy强推,分词领域必读:自动钓鱼让大模型“发疯”的token,来自Transformer作者创业公司
关于大模型分词(tokenization),大神Karpathy刚刚推荐了一篇必读新论文。 主题是:自动检测大模型中那些会导致“故障”的token。 图片 简单来说,由于大模型tokenizer的创建和模型训练是分开的,可能导致某些token在训练中很少...
-
企业如何管理生成式人工智能安全风险
事实表明,尽管有很多好处,但生成式人工智能也给企业带来了许多安全挑战,而且可能代价高昂。而企业需要审查可能的威胁和最佳实践以降低风险。 在ChatGPT推出之后,生成式人工智能模型的迅速采用有望从根本上改变企业开展业务以及与客户和供应商互动的方式。 生...
-
原作者带队,LSTM真杀回来了!
20 世纪 90 年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思想。三十多年来,LSTM 经受住了时间的考验,并为众多深度学习的成功案例做出了贡献。然而,以可并行自注意力为核心 Transformer 横空出世之后,LSTM 自身所...
-
所有生命分子一夜皆可AI预测!AlphaFold 3改变人类对生命的理解,全球科学家都能免费使用
AlphaFold 3再登Nature! 这次重磅升级,不再仅限于蛋白质结构预测——可以以前所未有的精度预测所有生命分子的结构和相互作用。 只有了解它们如何在数百万种组合中相互作用,我们才能开始真正理解生命的过程。 这次的最大创新之一,是用上了AI绘画...
-
大厂AI人,奔向香港
“现在在香港,遍地都是AI创业的前大厂人,百万融资不难拿到。” 30岁的大厂P7黄全,刚刚搬离西二旗的工位,就在2024年1月前往香港尝试AI创业,这是他寻找出路的首选。 香港对科创类项目的鼎力支持,让他迎来了惊喜的开局。两大科创集群——香港科技园和香港数...
-
时间序列概率预测的共形预测
前面我们介绍了用于时间序列概率预测的分位数回归,今天继续学习基于概率预测的时间序列概率预测方法--共形预测。 现实世界中的应用和规划往往需要概率预测,而不是简单的点估计值。概率预测也称为预测区间或预测不确定性,能够提供决策者对未来的不确定性状况有更好的认...
-
理论+实践,带你了解分布式训练
本文分享自华为云社区《大模型LLM之分布式训练》,作者: 码上开花_Lancer。 随着语言模型参数量和所需训练数据量的急速增长,单个机器上有限的资源已无法满足大语言模型训练的要求。需要设计分布式训练(Distributed Training)系统来解决...
-
LidaRF:研究用于街景神经辐射场的激光雷达数据(CVPR'24)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 光真实感模拟在自动驾驶等应用中发挥着关键作用,其中神经辐射场(NeRFs)的进步可能通过自动创建数字3D资产来实现更好的可扩展性。然而,由于街道上相机运动的高度共线性和在高速下的稀疏采样,街景的重建质...
-
港大开源图基础大模型OpenGraph: 强泛化能力,前向传播预测全新数据
图学习领域的数据饥荒问题,又有能缓解的新花活了! OpenGraph,一个基于图的基础模型,专门用于在多种图数据集上进行零样本预测。 背后是港大数据智能实验室的主任Chao Huang团队,他们还针对图模型提出了提示调整技术,以提高模型对新任务的适应性。...
-
探索生成式人工智能的版权清算问题
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 法院正在探讨并决定生成式人工智能是否侵犯版权。本文中,让我们来谈谈这到底意味着什么。 美国的版权法是一件复杂的事情。我们这些不是律师的...
-
据报道,微软正在开发拥有5000亿个参数的MAI-1人工智能模型
据The Information近日报道,微软公司正在开发一个拥有约5000亿个参数的大型语言模型。 据悉,这个在微软内部被称为MAI-1的大型语言模型预计最早将于本月亮相。 OpenAI在2020年中期推出 GPT-3 时,详细说明了该模型的初始版...
-
使用LLMLingua-2压缩GPT-4和Claude提示
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 缩短发送给大型语言模型(LLM 的提示的长度可以减少推理时间并降低成本。这是提示压缩成为LLM研究的一个热门领域的原因。 清华大学和微...
-
LeCun转发,AI让失语者重新说话!纽约大学发布全新「神经-语音」解码器
脑机接口(BCI)在科研和应用领域的进展在近期屡屡获得广泛的关注,大家通常都对脑机接口的应用前景有着广泛的畅享。 比如,由于神经系统的缺陷造成的失语症不仅严重阻碍患者的日常生活,还可能限制他们的职业发展和社交活动。随着深度学习和脑机接口技术的迅猛发展,...
-
AI正在左右TikTok与Instagram观点?区块链或可解决问题
强大且易于使用的生成式AI正在快速崛起,并开始撼动社交媒体的基本格局。新的AI工具乃至AI影响者正在塑造我们通过TikTok及Instagram等平台开展交互的方式。这种影响不仅体现在内容的生成与传播方面,更对人类创作者构成了严峻的生存威胁。至于解决之...
-
挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队
不需要OpenAI,微软或许也会成为AI领头羊! 外媒Information爆料称,微软内部正在开发自家首款5000亿参数的大模型MAl-1。 这恰好是,纳德拉带领团队证明自己的时候到了。 在向OpenAI投资100多亿美元之后,微软才获得了GPT-3...
-
手机可跑,3.8B参数量超越GPT-3.5!微软发布Phi-3技术报告:秘密武器是洗干净数据
过去几年,借助Scaling Laws的魔力,预训练的数据集不断增大,使得大模型的参数量也可以越做越大,从五年前的数十亿参数已经成长到今天的万亿级,在各个自然语言处理任务上的性能也越来越好。 但Scaling Laws的魔法只能施加在「固定」的数据源上,...
-
报道称微软准备推新AI模型,内部代号MAI-1、约5000亿参数
据外媒the Information报道,微软正准备推出一种新的、内部 AI 语言模型。 新模型内部代号为 MAI-1,由最近加入微软的梅斯塔法・苏莱曼负责,他是谷歌 DeepMind 的联合创始人,也是人工智能初创公司 Inflection 的前 CEO...
-
关于人工智能,专家不愿透露的秘密!
如今,人工智能(AI 已经成为我们生活中不可分割的一部分。专家们通常会指出人工智能的优势,但可能不会很快提到这项技术的问题。本文将深入挖掘人工智能专家不愿意透露的隐藏秘密。 1.人工智能并非万无一失 虽然人工智能系统可以使数字更精确的许多倍,但并非完美...
-
特斯拉机器人进厂打工,马斯克:手的自由度今年将达到22个!
特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。 正常速度下,它分拣电池(特斯拉的4680电池)是这样的: 官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣: 这次放出的视频亮点之一在于Optimus在厂子里完成这项工作...
-
特斯拉Optimus人形机器人进厂打工,娴熟分装电池、自我矫正,还能走更远了
特斯拉人形机器人又解锁了新技能! 昨日,Tesla Optimus 官方发布了新的 demo 视频,展示了二代 Optimus 人形机器人的最新进展。 这次,Optimus 开始进厂打工了,在特斯拉电池工厂学会了分装电池,并且比以前走得更快更远更稳了。...
-
AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了
AI做数学题,真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在一些复杂任务上的表现也能大幅提升! 一作Jacab Pfau表示:只要花费算力生成额外token就能带来优势,具体选择了什么token无...
-
终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
当前最火的大模型,竟然三分之二都存在过拟合问题? 刚刚出炉的一项研究,让领域内的许多研究者有点意外。 提高大型语言模型的推理能力是当前研究的最重要方向之一,而在这类任务中,近期发布的很多小模型看起来表现不错,比如微软 Phi-3、Mistral 8x2...
-
专利大模型的实践与知识问答探索
一、专利大模型背景介绍 智慧芽一直致力于为科技创新和知识产权领域提供信息服务。在小型模型时代(如 Bert),参数量较少,智能理解方面存在局限性。因此,在着手开发大模型之前,智慧芽深入思考了领域聚焦的重要性。在知识产权领域,专利检索、专利对比、标引工作...
-
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
除了计算资源和训练数据这些硬实力外,Llama3模型开源的训练思路覆盖了LLM模型的全部生命周期,提供了各种开源生态系统下的工具。 Llama3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。 最近,M...
-
「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?
前段时间,微软搞了个乌龙:隆重地开源了 WizardLM-2,又在不久后撤回得干干净净。 据现在可以查到的 WizardLM-2 发布信息,这是一个「真正媲美 GPT-4」的开源大模型,在复杂聊天、多语言、推理和代理方面的性能得到了提高。 该系列包括三个...
-
开源大模型王座再易主,通义千问1100亿参数拿下SOTA,3个月已推出8款模型
开源大模型,已经开启大卷特卷模式。 全球范围,太平洋两岸,双雄格局正在呼之欲出。 Llama 3中杯大杯刚惊艳亮相,国内通义千问就直接开源千亿级参数模型Qwen1.5-110B,一把火上Hacker News榜首。 不仅相较于自家720亿参数模型性能明...
-
还在YOLO-World?DetCLIPv3出手!性能大幅度超出一众SOTA!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 现有的开词汇目标检测器通常需要用户预设一组类别,这大大限制了它们的应用场景。在本文中,作者介绍了DetCLIPv3,这是一种高性能检测器,不仅在开词汇目标检测方面表现出色,同时还能为检测到的目标生成...
-
OpenAI与英国金融时报签署合作协议,为ChatGPT提供许可内容
OpenAI 近日宣布与英国知名新闻日报《金融时报》签署战略合作伙伴关系,旨在扩大 ChatGPT 上可用的新闻内容。根据协议,ChatGPT 将以相应查询方式呈现《金融时报》的文章,并附上必要的摘要、引述和链接。双方在一份新闻稿中指出,所有来自《金融时报...
-
报道称,苹果App Store下架三款AI脱衣软件
据404Media报道,苹果已经从 App Store 中移除了三款被宣传为 “艺术生成器” 的应用程序,这些应用在 Instagram 和成人网站上宣传自己可以 “免费脱掉任何女孩的衣服”。 这些应用利用人工智能生成虚假的裸体图像,虽然图像并不显示实际...