-
硬核解决Sora的物理bug!美国四所顶尖高校联合发布:给视频生成器装个物理引擎
Sora刚发布后没多久,火眼金睛的网友们就发现了不少bug,比如模型对物理世界知之甚少,小狗在走路的时候,两条前腿就出现了交错问题,让人非常出戏。 对于生成视频的真实感来说,物体的交互非常重要,但目前来说,合成真实3D物体在交互中的动态行为仍然非常困难。...
-
瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破
机器狗在瑜伽球上稳稳当当的行走,平衡力那是相当的好: 各种场景都能拿捏,不管是平坦的人行道、还是充满挑战的草坪都能 hold 住: 甚至是研究人员踢了一脚瑜伽球,机器狗也不会歪倒: 给气球放气机器狗也能保持平衡: 上述展示都是 1 倍速,没有经过...
-
MLP一夜被干掉!MIT加州理工等革命性KAN破记录,发现数学定理碾压DeepMind
一夜之间,机器学习范式要变天了! 当今,统治深度学习领域的基础架构便是,多层感知器(MLP)——将激活函数放置在神经元上。 那么,除此之外,我们是否还有新的路线可走? 就在今天,来自MIT、加州理工、东北大学等机构的团队重磅发布了,全新的神经网络结构...
-
12年前上手深度学习,Karpathy掀起一波AlexNet时代回忆杀,LeCun、Goodfellow等都下场
没想到,自 2012 年 AlexNet 开启的深度学习革命已经过去了 12 年。 而如今,我们也进入了大模型的时代。 近日,知名 AI 研究科学家 Andrej Karpathy 的一条帖子,让参与这波深度学习变革的许多大佬们陷入了回忆杀。从图灵奖得主...
-
「代理人战争」!微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱
【新智元导读】为了搞钱,微软、OpenAI 、谷歌和Meta纷纷瞄准Agent这片蓝海,各顶尖高校也紧随其后。Agent才是商业学术两开花的未来! 大模型发展至今早已火成了一个「概念」。 不管是学术界还是工业界,都要套上一层LLM的皮,方可彰显自己位于浪潮...
-
人工智能将如何影响药物研发
创造新药是一个艰苦的过程,需要多年的努力和大量的资金才能取得重大进展。在如此巨大的资金和生命攸关的情况下,加速药物发现过程一直是行业专业人士最关心的话题。 就像其他所有涉及大量耗时任务的行业一样,随着人工智能工具的引入,药物发现正在经历一场革命。 虽然...
-
苹果 AI 计划曝光:更智能的 Siri 即将到来
苹果在人工智能领域看似起步较晚,但最近的传闻和报告表明,苹果一直在等待时机,准备迈出重要一步。 据报道,苹果正在与 OpenAI 和谷歌合作,同时也在研发自己的模型 Ajax 从苹果公布的 AI 研究来看,公司的 AI 战略逐渐清晰。近期有消息称,苹果计划...
-
低成本LLM应用开发利器——开源FrugalGPT框架
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 本文将详细介绍一个LLM驱动型应用程序的成本节约架构FrugalGPT。 大型语言模型为计算机科学开辟了一个新的前沿;然而,它们(截至...
-
AI可以改写人类基因组吗?首次由AI从头设计的基因编辑器成功编辑人类细胞中DNA
生成式 AI 可以对话、写诗、画图、做视频、作曲、写代码...... 那么,AI 可以改写人类基因组吗? 现在,新的 AI 技术正在为可编辑 DNA 的微观生物机制绘制蓝图,这预示着未来科学家将以更高的精度和速度对抗疾病。 近日,美国 AI 蛋白质设计初...
-
Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
除了计算资源和训练数据这些硬实力外,Llama3模型开源的训练思路覆盖了LLM模型的全部生命周期,提供了各种开源生态系统下的工具。 Llama3的开源,再次掀起了一场大模型的热战,各家争相测评、对比模型的能力,也有团队在进行微调,开发衍生模型。 最近,M...
-
美国酝酿AI「登月计划」,陶哲轩领衔62页报告重磅发布!
就在刚刚,陶哲轩领衔的一份62页报告出炉了,总结和预测了AI对半导体、超导体、宇宙基础物理学、生命科学等领域带来的巨大改变。如果这些预测在几十年后能够实现,美国酝酿的AI「登月计划」就将成真。 就在刚刚,陶哲轩领衔的一份AI技术对全球研究潜在影响的技术报告...
-
苹果推出理解、转化模型ReALM,性能超GPT-4
苹果的研究人员推出了一种创新模型ReALM,可将参考解析问题转化为语言建模问题,能极大提升AI助手处理很多描述复杂或模糊不清的内容。 例如,我们网购时选好了橘子、鸭梨、苹果、橘子汽水、洗发水、短袖、拖鞋等物品,然后告诉AI助手只结算水果。这时传统的AI助手...
-
谷歌DeepMind新方法Gecko,为测试AI图像生成器引入严格新标准
谷歌 DeepMind 最近的研究示了当前我们对文本到图像 AI 模型性能评估的隐藏局限性。在其发布在预印本服务器 ariv 上的研究中,他们引入了一种全新的方法称为 “Gecko”,承诺提供一个更全和可靠的基准,以评估这一蓬勃发展的技术。 研究团队在其...
-
2024年开源人工智能的重要性
到2024年,对开源人工智能的需求将继续增长。开源人工智能使开发人员能够访问和构建彼此的工作成果,从而实现该领域的合作、透明度和创新。这加速了人工智能技术的发展,提高了可访问性,并使人工智能能力民主化。让我们简要讨论一下开源人工智能的重要性。 以下是关...
-
人工智能在太空探索和人居工程中的演变
人工智能(AI 诞生于 20 世纪 50 年代,当时研究人员发现机器可以执行类似人类的任务,例如思考。后来,在 20 世纪 60 年代,美国国防部资助了人工智能,并建立了实验室进行进一步开发。研究人员发现人工智能在许多领域都有用武之地,例如太空探索和...
-
Sora爆火短频“气球人”制作者亲述优缺点:视频其实都是专业制作,Sora占一小部分;一致性不能很好控制;似有识别版权问题的机制
整理 | 言征 OpenAI 的视频生成工具 Sora在2月份让业界大吃一惊,其流畅、逼真的视频似乎远远领先于竞争对手。然而这场精心策划的首次亮相,留给了大众太多不为人知的细节。 近日, OpenAI 大火的宣传短片的制作团队之一的Shy Kids...
-
单卡跑Llama 70B快过双卡,微软硬生生把FP6搞到了A100里 | 开源
FP8和更低的浮点数量化精度,不再是H100的“专利”了! 老黄想让大家用INT8/INT4,微软DeepSpeed团队在没有英伟达官方支持的条件下,硬生生在A100上跑起FP6。 测试结果表明,新方法TC-FPx在A100上的FP6量化,速度接近甚至...
-
InstantMesh:新AI框架可在10秒内从2D图像生成高质量3D网格
根据研究团队发表的预印本文章,InstantMesh是由腾讯PCG ARC实验室和上海科技大学的研究人员开发的人工智能框架,能够在仅需10秒的时间内,从单个2D图像生成高质量的3D网格。 该开源框架由多视图扩散模型和3D网格重建模型组成,通过使用不同角度...
-
中国首个Sora级大模型Vidu:文本生成16秒,1080p高清视频
4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。 据悉,Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT,支持文本生成长达...
-
前谷歌CEO盛赞!GitHub Copilot 神秘竞争对手浮出水面,市值直逼独角兽!
各种编程Copilot彻底卷起来了,不止国外的微软、谷歌、Meta,国内的百度、阿里、商汤等AI巨头盯上了编程这块肥肉,不少初创公司也毅然决然的选择了这条赛道。 最近,那位曾经把Java带成Sun巅峰的CTO、前谷歌CEO 施密特(Eric Schmid...
-
最新综述!万字长文彻底搞懂单目3D车道线检测
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 3D车道检测在自动驾驶中起着至关重要的作用,通过从三维空间中提取道路的结构和交通信息,协助自动驾驶汽车进行合理、安全和舒适的路径规划和运动控制。考虑到传感器成本和视觉数...
-
人工智能的十大局限性
在技术创新领域,人工智能(AI 是我们这个时代最具变革性和前景的发展之一。人工智能凭借其分析大量数据、从模式中学习并做出智能决策的能力,已经彻底改变了从医疗保健和金融到交通和娱乐等众多行业。然而,在取得显著进步的同时,人工智能也面临着阻碍其充分发挥潜力的...
-
革新LLM微调之道:全方位解读PyTorch原生库torchtune的创新力量与应用价值
在人工智能领域,大语言模型(LLMs)正日益成为研究和应用的新热点。然而,如何高效、精准地对这些庞然大物进行调优,一直是业界和学术界面临的重要挑战。近期,PyTorch官方博客发布了一篇关于TorchTune的文章,引起了广泛关注。TorchTune作为...
-
OpenAI Preparedness团队首席Aleksander Madry:机器学习模型的内部计算如何将输入转化为预测?
考虑一个标准的ResNet50模型,该模型经过训练用于图像分类任务。我们是否能够理解这个模型中的卷积滤波器如何将输入图像转换为其预测的标签?或者,GPT-3中的注意力头如何contribute到下一个标记的预测?理解这些模型组件——包括滤波器或头等架构...
-
黄仁勋亲自给OpenAI送货,全球首台DGX H200开箱了
今天,黄仁勋又来送 AI 芯片了,还是超强悍的那种。 OpenAI 联合创始人、总裁 Greg Brockman 发推,晒出了自己、OpenAI CEO 奥特曼与英伟达创始人兼 CEO 黄仁勋的合照。 他表示,老黄亲自为 OpenAI 送来了全球第一台...
-
LLM 安全 | 大语言模型应用安全入门
一、背景 2023年以来,LLM 变成了相当炙手可热的话题,以 ChatGPT 为代表的 LLM 的出现,让人们看到了无限的可能性。ChatGPT能写作,能翻译,能创作诗歌和故事,甚至能一定程度上做一些高度专业化的工作,比如法律服务和医疗诊断咨询。...
-
科学家使用机器学习证明物质罕见阶段的存在
乍一看,玻璃和水晶可能看起来很相似,然而,当放在显微镜下观察时,它们的结构有很大的不同。晶体具有完美有序和重复的原子模式,而玻璃则是类似流体的无序结构。 在物理学中,玻璃态被认为是物质的一种特殊形式。在短时间玻璃表现得很像固体。然而,在较长一段时间内,...
-
颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑
近日,颜水成教授团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。 项...
-
LinkedIn调查显示:AI威胁下,女性工作更易被取代
随着人工智能的发展,许多员工担心他们的工作将被取代,越来越多的研究表明,女性可能最为担忧。最近国际货币基金组织的一份报告发现,在美国等先进经济体,约60% 的工作可能受到人工智能的影响。 图源备注:图片由AI生成,图片授权服务商Midjourney 在那...
-
Nvidia CEO黄仁勋亲自向OpenAI交付第一台DGX H200
Nvidia CEO 黄仁勋亲自将首个 Nvidia DGX H200交付至旧金山的 OpenAI 办公室,这一举动彰显了人工智能行业两大巨头之间紧密的联系。OpenAI 总裁兼联合创始人 Greg Brockman 在推特上发布了一张照片,展示了这一事件...
-
生成式AI:三块短板、两道难题、一个悖论
闫德利腾讯研究院资深专家 炼大模型,大炼模型 近年是全球风险投资的低潮,生成式AI(GenAI)却逆市而起,去年的融资笔数和融资额分别增长66%和400%(来源:CB Insight,如下图所示 ,融资额高居所有细分领域第一位(来源:Dealroom.co...
-
微软3.8B模型媲美GPT-3.5!小到用iPhone就能跑起来,网友:Good data is all you need!
撰文、整理 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 这周,“小模型”之战打得可谓精彩非凡,让人目不暇接。前脚,小扎刚在采访中自豪地宣布Llama3 80亿模型几乎与此前Llama2 700亿模型的性能差不多...
-
AI成功改写人类DNA,全球首个基因编辑器震撼开源!近5倍蛋白质宇宙LLM全生成
AI,能够重写人类基因组了? 就在刚刚,初创公司Profluent宣布,完全由AI设计的基因编辑器,已经成功编辑了人类细胞中的DNA。 也就是说,世界上首个使用AI从头设计的分子级精确基因编辑器诞生了。 就像ChatGPT能生成诗歌一样,Proflue...
-
研究显示,GPT-4可以自主利用安全漏洞,具备攻击性
每周至少有一次,生成式人工智能都会给我们带来新的恐惧。虽然我们仍在焦急地等待 OpenAI 发布的下一个大型语言模型,但与此同时,GPT-4似乎比你想象的更具备能力。最近的一项研究表明,研究人员展示了 GPT-4可以在没有人类干预的情况下利用网络安全漏洞。...
-
2024年8个AI商业趋势 最先进的AI模型变得越来越昂贵
斯坦福大学人类中心人工智能研究所发布的2024年人工智能指数,报告揭示了人工智能在商业领域的八大趋势,涵盖了人类优势、成本、监管、投资增长、工作效率提升等方面的关键问题,为企业和决策者提供了重要的参考和启示。 1. 人类在许多任务上仍然优于人工智能 研究表...
-
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试
上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。 有网友突然发现,WizardLM的模型权重、公告帖子全部被删除,并且不再微软集合中,除了提到站点之外,却找不到任何证据证明这个微软的官方项目。...
-
开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了
虽然大型语言模型(LLM)在各种常见的自然语言处理任务中展现出了优异的性能,但随之而来的幻觉,也揭示了模型在真实性和透明度上仍然存在问题。 在模型生成错误回复内容时,如果能够「深入理解其背后运行机制」,或许可以解决模型的幻觉问题。 然而,随着深度神经网络...
-
加州理工华人用AI颠覆数学证明!提速5倍震惊陶哲轩,80%数学步骤全自动化
Lean Copilot,让陶哲轩等众多数学家赞不绝口的这个形式化数学工具,又有超强进化了? 就在刚刚,加州理工教授Anima Anandkumar宣布,团队发布了Lean Copilot论文的扩展版本,并且更新了代码库。 图片 论文地址:https:/...
-
ChatGPT能预测未来特定事件,准确率高达97%
贝勒大学经济学院的Pham Hoang Van和Scott Cunningham两位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。 研究人员使用了直接预测和未来叙述(Future Narrative)两种提示方法,进行...
-
药物分子设计新策略,微软条件扩散模型DiffLinker登Nature子刊
药理学领域的化学空间高达 10^60,在广阔的化学空间中进行搜索,给药物设计带来了巨大的挑战。 基于片段的药物发现一直是早期药物开发的有效范例。然而,该领域面临的一个挑战是,如何设计断开的感兴趣分子片段之间的连接子(linker),生成化学上合理的候选药...
-
集体智慧:LLM预测能力与人群可相互媲美
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 现在,AI系统的预测准确率达到甚至超过了人群。 在不断发展的人工智能(AI)领域,语言模型已取得了重大进展,实现了曾经被认为人类认知...
-
GPT-4化身黑客搞破坏,成功率87%,OpenAI要求保密提示词,网友复现ing
91行代码、1056个token,GPT-4化身黑客搞破坏! 测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。 这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模...
-
轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便
一个可以自动分析PDF、网页、海报、Excel图表内容的大模型,对于打工人来说简直不要太方便。 上海AI Lab,香港中文大学等研究机构提出的InternLM-XComposer2-4KHD(简写为IXC2-4KHD)模型让这成为了现实。 相比于其他多模...
-
谷歌整合 AI 重心,DeepMind 和研究团队合并
谷歌在周四宣布将整合旗下专注于构建人工智能(AI)模型的两个内部团队。 Alphabet 和谷歌 CEO 桑达尔・皮查伊在公司网站上发布了一篇博客文章,解释了将 AI 模型构建团队整合到谷歌 DeepMind 团队内的决定,其中包括来自公司研究部门的团队。...
-
AI教母李飞飞:AI学术界没钱没资源!没有拨款将会凋亡
在计算机领域,究竟是搞工程还是做科研,一直都是一道不算容易的选择题。 不过,说到底程序员也是打工人。所以对大部分人来说,在拿更多的薪水和推动学术界进步之间,应该都会选前者。 而就收入来说,科技公司巨头从来都不吝啬给人才花钱——各种让普通打工人瞠目结舌的薪...
-
GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing
91行代码、1056个token,GPT-4化身黑客搞破坏! 测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。 这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模...
-
4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源
蛋白质结构相比于序列往往被认为更加具有信息量,因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破,大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。 西湖大学的研究人员利用Fo...
-
数字孪生应用新方向:分析婴儿发育情况
芝加哥大学领导的研究表明,AI技术驱动的“数字孪生”能够对婴儿微生物组进行建模,从而预测婴儿成长后期可能出现的神经发育问题。 利用早产儿粪便样本中的极早期肠道微生物组相关数据,数字孪生能够非常准确地预测其后期微生物组构成,以及相对应的神经发育缺陷。 这...
-
英特尔用 AI 简化酷睿 Ultra 处理器设计流程,将数周分析作业压缩至几分钟
4 月 17 日消息,英特尔在近日的一份博客中表示,其已将 AI 广泛用于包括酷睿 Ultra 处理器的热设计在内的工作中。 以酷睿 Ultra 处理器为代表的客户端产品在运行过程中严重依赖睿频功能。在睿频中处理器频率提升,同时产生更多的热量。 为了充...
-
从文字模型到世界模型!Meta新研究让AI Agent理解物理世界
LLM已经可以理解文本和图片了,也能够根据它们的历史知识回答各种问题,但它们或许对周围世界当前发生的事情一无所知。 现在LLMs也开始逐步学习理解3D物理空间,通过增强LLMs的「看到」世界的能力,人们可以开发新的应用,在更多场景去获取LLMs的帮助。...