-
中国首个Sora级大模型Vidu:文本生成16秒,1080p高清视频
4月27日,在2024中关村论坛-未来人工智能先锋论坛上,清华大学联合生数科技正式发布了,中国首个长时间、高一致性、高动态性视频大模型——Vidu。 据悉,Vidu采用了原创的Diffusion与Transformer融合的架构U-ViT,支持文本生成长达...
-
前谷歌CEO盛赞!GitHub Copilot 神秘竞争对手浮出水面,市值直逼独角兽!
各种编程Copilot彻底卷起来了,不止国外的微软、谷歌、Meta,国内的百度、阿里、商汤等AI巨头盯上了编程这块肥肉,不少初创公司也毅然决然的选择了这条赛道。 最近,那位曾经把Java带成Sun巅峰的CTO、前谷歌CEO 施密特(Eric Schmid...
-
最新综述!万字长文彻底搞懂单目3D车道线检测
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 3D车道检测在自动驾驶中起着至关重要的作用,通过从三维空间中提取道路的结构和交通信息,协助自动驾驶汽车进行合理、安全和舒适的路径规划和运动控制。考虑到传感器成本和视觉数...
-
人工智能的十大局限性
在技术创新领域,人工智能(AI 是我们这个时代最具变革性和前景的发展之一。人工智能凭借其分析大量数据、从模式中学习并做出智能决策的能力,已经彻底改变了从医疗保健和金融到交通和娱乐等众多行业。然而,在取得显著进步的同时,人工智能也面临着阻碍其充分发挥潜力的...
-
革新LLM微调之道:全方位解读PyTorch原生库torchtune的创新力量与应用价值
在人工智能领域,大语言模型(LLMs)正日益成为研究和应用的新热点。然而,如何高效、精准地对这些庞然大物进行调优,一直是业界和学术界面临的重要挑战。近期,PyTorch官方博客发布了一篇关于TorchTune的文章,引起了广泛关注。TorchTune作为...
-
OpenAI Preparedness团队首席Aleksander Madry:机器学习模型的内部计算如何将输入转化为预测?
考虑一个标准的ResNet50模型,该模型经过训练用于图像分类任务。我们是否能够理解这个模型中的卷积滤波器如何将输入图像转换为其预测的标签?或者,GPT-3中的注意力头如何contribute到下一个标记的预测?理解这些模型组件——包括滤波器或头等架构...
-
黄仁勋亲自给OpenAI送货,全球首台DGX H200开箱了
今天,黄仁勋又来送 AI 芯片了,还是超强悍的那种。 OpenAI 联合创始人、总裁 Greg Brockman 发推,晒出了自己、OpenAI CEO 奥特曼与英伟达创始人兼 CEO 黄仁勋的合照。 他表示,老黄亲自为 OpenAI 送来了全球第一台...
-
LLM 安全 | 大语言模型应用安全入门
一、背景 2023年以来,LLM 变成了相当炙手可热的话题,以 ChatGPT 为代表的 LLM 的出现,让人们看到了无限的可能性。ChatGPT能写作,能翻译,能创作诗歌和故事,甚至能一定程度上做一些高度专业化的工作,比如法律服务和医疗诊断咨询。...
-
科学家使用机器学习证明物质罕见阶段的存在
乍一看,玻璃和水晶可能看起来很相似,然而,当放在显微镜下观察时,它们的结构有很大的不同。晶体具有完美有序和重复的原子模式,而玻璃则是类似流体的无序结构。 在物理学中,玻璃态被认为是物质的一种特殊形式。在短时间玻璃表现得很像固体。然而,在较长一段时间内,...
-
颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑
近日,颜水成教授团队联合发布并开源了Vitron通用像素级视觉多模态大语言模型。 项...
-
LinkedIn调查显示:AI威胁下,女性工作更易被取代
随着人工智能的发展,许多员工担心他们的工作将被取代,越来越多的研究表明,女性可能最为担忧。最近国际货币基金组织的一份报告发现,在美国等先进经济体,约60% 的工作可能受到人工智能的影响。 图源备注:图片由AI生成,图片授权服务商Midjourney 在那...
-
Nvidia CEO黄仁勋亲自向OpenAI交付第一台DGX H200
Nvidia CEO 黄仁勋亲自将首个 Nvidia DGX H200交付至旧金山的 OpenAI 办公室,这一举动彰显了人工智能行业两大巨头之间紧密的联系。OpenAI 总裁兼联合创始人 Greg Brockman 在推特上发布了一张照片,展示了这一事件...
-
生成式AI:三块短板、两道难题、一个悖论
闫德利腾讯研究院资深专家 炼大模型,大炼模型 近年是全球风险投资的低潮,生成式AI(GenAI)却逆市而起,去年的融资笔数和融资额分别增长66%和400%(来源:CB Insight,如下图所示 ,融资额高居所有细分领域第一位(来源:Dealroom.co...
-
微软3.8B模型媲美GPT-3.5!小到用iPhone就能跑起来,网友:Good data is all you need!
撰文、整理 | 伊风 出品 | 51CTO技术栈(微信号:blog51cto) 这周,“小模型”之战打得可谓精彩非凡,让人目不暇接。前脚,小扎刚在采访中自豪地宣布Llama3 80亿模型几乎与此前Llama2 700亿模型的性能差不多...
-
AI成功改写人类DNA,全球首个基因编辑器震撼开源!近5倍蛋白质宇宙LLM全生成
AI,能够重写人类基因组了? 就在刚刚,初创公司Profluent宣布,完全由AI设计的基因编辑器,已经成功编辑了人类细胞中的DNA。 也就是说,世界上首个使用AI从头设计的分子级精确基因编辑器诞生了。 就像ChatGPT能生成诗歌一样,Proflue...
-
研究显示,GPT-4可以自主利用安全漏洞,具备攻击性
每周至少有一次,生成式人工智能都会给我们带来新的恐惧。虽然我们仍在焦急地等待 OpenAI 发布的下一个大型语言模型,但与此同时,GPT-4似乎比你想象的更具备能力。最近的一项研究表明,研究人员展示了 GPT-4可以在没有人类干预的情况下利用网络安全漏洞。...
-
2024年8个AI商业趋势 最先进的AI模型变得越来越昂贵
斯坦福大学人类中心人工智能研究所发布的2024年人工智能指数,报告揭示了人工智能在商业领域的八大趋势,涵盖了人类优势、成本、监管、投资增长、工作效率提升等方面的关键问题,为企业和决策者提供了重要的参考和启示。 1. 人类在许多任务上仍然优于人工智能 研究表...
-
发布几小时,微软秒删媲美GPT-4开源大模型!竟因忘记投毒测试
上周,微软空降了一个堪称GPT-4级别的开源模型WizardLM-2。 却没想到发布几小时之后,立马被删除了。 有网友突然发现,WizardLM的模型权重、公告帖子全部被删除,并且不再微软集合中,除了提到站点之外,却找不到任何证据证明这个微软的官方项目。...
-
开箱黑盒LLM!谷歌大一统框架Patchscopes实战教程来了
虽然大型语言模型(LLM)在各种常见的自然语言处理任务中展现出了优异的性能,但随之而来的幻觉,也揭示了模型在真实性和透明度上仍然存在问题。 在模型生成错误回复内容时,如果能够「深入理解其背后运行机制」,或许可以解决模型的幻觉问题。 然而,随着深度神经网络...
-
加州理工华人用AI颠覆数学证明!提速5倍震惊陶哲轩,80%数学步骤全自动化
Lean Copilot,让陶哲轩等众多数学家赞不绝口的这个形式化数学工具,又有超强进化了? 就在刚刚,加州理工教授Anima Anandkumar宣布,团队发布了Lean Copilot论文的扩展版本,并且更新了代码库。 图片 论文地址:https:/...
-
ChatGPT能预测未来特定事件,准确率高达97%
贝勒大学经济学院的Pham Hoang Van和Scott Cunningham两位教授,基于OpenAI的GPT-3.5、GPT-4深度研究了大模型对事情的预测能力。 研究人员使用了直接预测和未来叙述(Future Narrative)两种提示方法,进行...
-
药物分子设计新策略,微软条件扩散模型DiffLinker登Nature子刊
药理学领域的化学空间高达 10^60,在广阔的化学空间中进行搜索,给药物设计带来了巨大的挑战。 基于片段的药物发现一直是早期药物开发的有效范例。然而,该领域面临的一个挑战是,如何设计断开的感兴趣分子片段之间的连接子(linker),生成化学上合理的候选药...
-
集体智慧:LLM预测能力与人群可相互媲美
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 现在,AI系统的预测准确率达到甚至超过了人群。 在不断发展的人工智能(AI)领域,语言模型已取得了重大进展,实现了曾经被认为人类认知...
-
GPT-4化身黑客搞破坏,成功率87%,OpenAI要求保密提示词,网友复现ing
91行代码、1056个token,GPT-4化身黑客搞破坏! 测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。 这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模...
-
轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便
一个可以自动分析PDF、网页、海报、Excel图表内容的大模型,对于打工人来说简直不要太方便。 上海AI Lab,香港中文大学等研究机构提出的InternLM-XComposer2-4KHD(简写为IXC2-4KHD)模型让这成为了现实。 相比于其他多模...
-
谷歌整合 AI 重心,DeepMind 和研究团队合并
谷歌在周四宣布将整合旗下专注于构建人工智能(AI)模型的两个内部团队。 Alphabet 和谷歌 CEO 桑达尔・皮查伊在公司网站上发布了一篇博客文章,解释了将 AI 模型构建团队整合到谷歌 DeepMind 团队内的决定,其中包括来自公司研究部门的团队。...
-
AI教母李飞飞:AI学术界没钱没资源!没有拨款将会凋亡
在计算机领域,究竟是搞工程还是做科研,一直都是一道不算容易的选择题。 不过,说到底程序员也是打工人。所以对大部分人来说,在拿更多的薪水和推动学术界进步之间,应该都会选前者。 而就收入来说,科技公司巨头从来都不吝啬给人才花钱——各种让普通打工人瞠目结舌的薪...
-
GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing
91行代码、1056个token,GPT-4化身黑客搞破坏! 测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。 这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模...
-
4000万蛋白结构训练,西湖大学开发基于结构词表的蛋白质通用大模型,已开源
蛋白质结构相比于序列往往被认为更加具有信息量,因为其直接决定了蛋白质的功能。而随着AlphaFold2带来的巨大突破,大量的预测结构被发布出来供人研究使用。如何利用这些蛋白质结构来训练强大且通用的表征模型是一个值得研究的方向。 西湖大学的研究人员利用Fo...
-
数字孪生应用新方向:分析婴儿发育情况
芝加哥大学领导的研究表明,AI技术驱动的“数字孪生”能够对婴儿微生物组进行建模,从而预测婴儿成长后期可能出现的神经发育问题。 利用早产儿粪便样本中的极早期肠道微生物组相关数据,数字孪生能够非常准确地预测其后期微生物组构成,以及相对应的神经发育缺陷。 这...
-
英特尔用 AI 简化酷睿 Ultra 处理器设计流程,将数周分析作业压缩至几分钟
4 月 17 日消息,英特尔在近日的一份博客中表示,其已将 AI 广泛用于包括酷睿 Ultra 处理器的热设计在内的工作中。 以酷睿 Ultra 处理器为代表的客户端产品在运行过程中严重依赖睿频功能。在睿频中处理器频率提升,同时产生更多的热量。 为了充...
-
从文字模型到世界模型!Meta新研究让AI Agent理解物理世界
LLM已经可以理解文本和图片了,也能够根据它们的历史知识回答各种问题,但它们或许对周围世界当前发生的事情一无所知。 现在LLMs也开始逐步学习理解3D物理空间,通过增强LLMs的「看到」世界的能力,人们可以开发新的应用,在更多场景去获取LLMs的帮助。...
-
Stability AI宣布裁员20人,约占员工总数的10%
英国 AI 公司Stability AI 宣布裁员20人,占其员工总数的约10%。此前一天,该公司刚刚宣布扩大其旗舰模型的使用范围。 这一裁员决定是在其创始 CEO 离职后的动荡几周之后做出的。据 CNBC 报道,这家总部位于英国的 AI 公司运行着稳定扩...
-
网络安全领域如何拥抱新一代人工智能
因此,随着数字领域面临越来越复杂的威胁,GenAI在网络安全领域的整合预示着防御机制的新阶段。GenAI能够制作内容,从现有数据中学习,并对特定提示做出反应,这标志着网络安全领域的变革篇章,充满了充满希望的机会和紧迫的考虑。让我们深入探究一下这...
-
蚂蚁集团等发布开源大模型知识抽取框架OneKE
蚂蚁集团和浙江大学合作开发了一个名为 OneKE 的开源大模型知识抽取框架。该框架旨在帮助处理信息抽取、文本数据结构化和知识图谱构建等任务,为研究人员和开发者提供有力工具。 这个框架的作用是从海量数据中提取结构化知识,构建高质量的知识图谱,并建立知识要素之...
-
国内百模谁第一?清华14大LLM最新评测报告出炉,GLM-4、文心4.0站在第一梯队
在2023年的「百模大战」中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理地评价这些模型的能力,成为关键问题。 尽管国内外存在多个模型能力评测榜单,但它们的质量参差不齐,排名差...
-
K8s和大模型真的搭吗?
编译|言征 出品 | 51CTO技术栈(微信号:blog51cto) K8s和大模型真的搭吗? 本文抛出了一个问题,但答案仍有待验证。 1.K8s迎来了新的受众群体 假设一位机器学习研究人员阅读了一篇研究论文,并想在PyTorch环境中使用基于Pytho...
-
GPT-4 Turbo重回王座,ChatGPT免费升级!数学暴涨10%/上下文全面碾压
今天起,最新版的GPT-4 Turbo,正式向ChatGPT Plus用户开放了! 图片 有了GPT-4 Turbo加持后,ChatGPT写作、数学、逻辑推理和编码的能力得到提升。 小编小试,果然ChatGPT最新数据已经更新到了4月。 图片 根据基准测...
-
Meta AI 发布开源基准数据集OpenEQA 促进AI代理的 “体验智能”
Meta AI 研究人员今天发布了 OpenEQA,这是一个新的开源基准数据集,旨在衡量人工智能系统对 “体验式问答”(embodied question answering)的能力 —— 这种能力使人工智能系统能够理解现实世界,从而回答有关环境的自然语言...
-
新加坡国立大学 | 通过语言分割任何3D目标
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 本文研究了具有自由形式语言指令的开放词汇3D实例分割(OV-3DIS)。先前的作品只依赖于注释的基本类别进行训练,对看不见的长尾类别的泛化能力有限。最近的工作通过生成类...
-
Meta AI推MA-LMM:用于长视频理解的记忆增强多模态大模型
Meta AI近日推出了一种名为MA-LMM的新型模型,旨在解决长期视频理解中的挑战。LLMs在处理文本数据时表现出了令人印象深刻的能力,但在处理视频输入方面存在一些限制,例如上下文长度限制和GPU内存限制。 为了克服这些限制,研究人员提出了MA-LMM,...
-
扩散模型如何帮助创建更好的强化学习系统
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 扩散模型以其令人印象深刻的生成高质量图像的能力而闻名,它们是流行的文本到图像模型(例如DALL-E、Stable Diffusion和...
-
大模型时代,AI人才也是各家争夺的焦点
AI人才争夺战,正式打响! 在当今这个由技术驱动的时代,人工智能(AI)已成为推动未来创新的关键力量。随着AI技术的飞速发展,一场无声的战争正在硅谷激烈上演——AI人才争夺战。这场战争不仅涉及科技巨头之间的高薪对决,更体现了国家层面的战略布局。 马斯克曾直...
-
刚刚,图灵奖揭晓!史上首位数学和计算机最高奖“双料王”出现了
刚刚,“计算机界最高荣誉”图灵奖揭晓—— 复杂性理论先驱、普林斯顿高等研究院教授艾维·维格森(Avi Wigderson 摘得。 美国计算机协会(ACM)表示,表彰他对计算理论的基础性贡献,包括重塑人类对计算中随机性作用的理解,以及数十年来在理论计算机...
-
量子计算可靠性提升800倍!微软开启2级弹性量子计算新时代
限制量子计算发展的关键问题,就快被解决了! 对于整个量子生态系统来说,这是一个历史性的时刻。 ——近日,微软联合Quantinuum,向全世界展示了有史以来最可靠的逻辑量子比特。 论文地址:https://arxiv.org/pdf/2404.0228...
-
史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录
首位超越国际奥林匹克竞赛金牌得主的AI,刚刚诞生了! 印度理工学院海得拉巴分校、图宾根AI中心、剑桥大学的研究者发现—— 通过「吴方法」,可以让AI变成和人类数学奥赛银牌得主同样的水平,而「AI数学大师」AlphaGeometry,则直接超越了IMO金牌...
-
谷歌AI落后了 问题到底出在哪?
2023年年初,谷歌匆匆出兵,奋力开发AI模型,应对ChatGPT带来的压力。随后几个月里,谷歌加码测试生成式AI,内部出现几套模型,希望通过内部赛马拿出有竞争力的成果。 可惜,模型虽多,但没有一个可以与OpenAI CPT-4抗衡。无奈之下,谷歌只得...
-
来自Anthropic:如何衡量大语言模型的说服力?
尽管人们长期以来一直在质疑AI模型是否会在某些时候变得像人类一样具有说服力,从而改变人们的想法,但在模型规模与输出说服力程度之间的关系方面,实证研究一直有限。为了解决这个问题,研究人员开发了一种基本方法来衡量说服力,并将其用于比较三个不同世代(Clau...
-
研究发现,GPT-4在说服力方面比人类表现优秀82%
瑞士洛桑联邦理工学院(EPFL)的研究人员最近进行的一项研究表明,GPT-4在说服力方面比人类表现更出色,优势接近82%,准确来说是81.7%。该研究涉及820人围绕一系列主题展开辩论。这些主题包括是否应该考虑种族因素作为大学录取标准,以及像是否应该继续发...
-
雨云GPU云服务器搭建SD(Stable Diffusion)的教程,搭建自己的AI绘画网站,AIGC
Stable Diffusion是什么 Stable Diffusion是一种基于潜在扩散模型(Latent Diffusion Models)的文本到图像生成模型,由CompVis、Stability AI和LAION的研究人员和工程师共同创建。...