-
DMP技术开源,可提升AI图像预测精度
Diffusion Models as Prior (DMP)是一种新的方法,它在AI生成的图像中提高了语义预测的准确性。该创新性方法巧妙地将预先训练的文本到图像模型应用于各种任务,例如3D属性估计和语义分割,在有限的训练数据下表现优于现有技术。 项目地...
-
思维链提出者Jason Wei:关于大模型的6个直觉
还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI 研...
-
思维链提出者Jason Wei:关于大模型的六个直觉
还记得 Jason Wei 吗?这位思维链的提出者还曾共同领导了指令调优的早期工作,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 参与 ChatGPT 的开发工作。机器之心曾经报道过他为年轻 AI...
-
Meta语音达LLaMA级里程碑!开源MMS模型可识别1100+语言
【新智元导读】Meta的大规模多语言语音 (MMS) 项目将彻底改变语音技术,使用wav2vec 2.0的自监督学习,MMS将语音技术扩展到1100到4000种语言。 在语音方面,Meta又达到了另一个LLaMA级的里程碑。 今天,Me...
-
AI颠覆数学研究!陶哲轩借AI解开数学猜想,形式化成功惊呆数学圈
用AI工具辅助研究数学的项目,再一次被陶哲轩跑通! 三周前,他曾发布一篇博文,记录下自己使用Blueprint在Lean4中形式化多项式Freiman-Ruzsa猜想的证明过程。 就在昨天,他激动宣布:将多项式Freiman-Ruzsa猜想的证明形式化...
-
AI颠覆数学研究!陶哲轩借AI破解数学猜想,形式化成功惊呆数学圈
历时三周,陶哲轩成功地用AI工具完成了形式化多项式Freiman-Ruzsa猜想证明过程的工作。他再次呼吁数学研究者学会正确利用AI工具,网友惊呼:以后的数学论文不需要人类可读了? 用AI工具辅助研究数学的项目,再一次被陶哲轩跑通! 三周前,他曾发布一篇博...
-
使用 AI 越狱 AI 模型:新方法可系统地探测 GPT-4 等大型语言模型的弱点,从而使其行为异常
上个月,OpenAI 董事会突然解雇了该公司的首席执行官,这引发了人们的猜测:董事会成员对人工智能突飞猛进的发展速度以及过快寻求技术商业化可能带来的风险感到震惊。 Robust Intelligence 是一家成立于 2020 年的初创公司,与耶鲁大学的...
-
七月论文审稿GPT第2版:从Meta Nougat、GPT4审稿到Mistral、LongLora Llama
前言 如此前这篇文章《学术论文GPT的源码解读与微调:从chatpaper、gpt_academic到七月论文审稿GPT》中的第三部分所述,对于论文的摘要/总结、对话、翻译、语法检查而言,市面上的学术论文GPT的效果虽暂未有多好,可至少还过得去,而如果涉...
-
颠覆Transformer霸权!CMU普林斯顿推Mamba新架构,解决致命bug推理速度暴增5倍
深度学习进入新纪元,Transformer的霸主地位,要被掀翻了? 2017年6月12日横空出世,让NLP直接变天,制霸自然语言领域多年的Transformer,终于要被新的架构打破垄断了。 Transformer虽强大,却有一个致命的bug:核心注意力...
-
【极客技术】真假GPT-4?微调 Llama 2 以替代 GPT-3.5/4 已然可行!
近日小编在使用最新版GPT-4-Turbo模型(主要特点是支持128k输入和知识库截止日期是2023年4月)时,发现不同商家提供的模型回复出现不一致的情况,尤其是模型均承认自己知识库达到2023年4月,但当我们细问时,Fake GPT4-Turbo(暂且这...
-
GPT-4在医学问题上击败了专业调优的 MedPaLM 2 模型
在研究中,微软的研究人员展示了GPT-4在医学知识测试中的卓越表现,特别是当结合先进的提示工程技术时,其性能超过了专业调整的MedPaLM2。 研究结果显示,相较于费时费力的调优和模型训练,将更有效的提示工程应用于主流通用模型可能是实现更准确结果的更好途径...
-
GPT-4没通过图灵测试!60年前老AI击败了ChatGPT,但人类胜率也仅有63%
长久以来,「图灵测试」成为了判断计算机是否具有「智能」的核心命题。 上世纪60年代,曾由麻省理工团队开发了史上第一个基于规则的聊天机器人ELIZA,在这场测试中失败了。 时间快进到现在,「地表最强」ChatGPT不仅能作图、写代码,还能胜任多种复杂任务...
-
驶向未来,首个多视图预测+规划自动驾驶世界模型来了
近期,世界模型的概念引发了火热浪潮,而自动驾驶领域岂能隔岸观「火」。来自中科院自动化所的团队,首次提出了一种名为 Drive-WM 的全新多视图世界模型,旨在增强端到端自动驾驶规划的安全性。 网站:https://drive-wm.github.io...
-
用GPT-4V和人类演示训练机器人:眼睛学会了,手也能跟上
如何将语言 / 视觉输入转换为机器人动作? 训练自定义模型的方法已经过时,基于最近大语言模型(LLM)和视觉语言模型(VLM)的技术进展,通过 prompt 工程使用 ChatGPT 或 GPT-4 等通用模型才是时下热门的方法。 这种方法绕过了海量数据...
-
AI绘画设计师专用单词表;游戏业AI正在疯抢工作;使用AI工具翻译整本英文书;用GPT-4搞定调研报告 | ShowMeAI日报
?日报&周刊合集 | ?生产力工具与行业应用大全 | ? 点赞关注评论拜托啦! ? 『如果是皮克斯制作了哈利波特系列』又萌又暖还可爱,想 rua!! 皮克斯是美国顶级的电脑动画制作公司,发布了《玩具总动员》《海底总动员》《超人...
-
最强的GPT-4V都考不过?基于大学考试的测试基准MMMU诞生了
目前最好的大型多模态模型 GPT-4V 与大学生谁更强?我们还不知道,但近日一个新的基准数据集 MMMU 以及基于其的基准测试或许能给我们提供一点线索,如下排行榜所示。 看起来,GPT-4V 在一些科目上已经强过挂科的大学生了。当然这个数据集的创造目的...
-
ChatGPT新漏洞:失控背出个人隐私泄露训练数据,OpenAI修复后依然有效
ChatGPT最新漏洞曝光,一句话就能让训练数据原封不动地泄露。 只需要让它重复一个词,它就会在一定次数后“发疯”,甚至毫无防备说出某人的个人隐私信息。 DeepMind的研究人员联合华盛顿大学、康奈尔大学等高校,发现了ChatGPT的数据泄露漏洞。...
-
ChatGPT狂吐训练数据,还带个人信息:DeepMind发现大bug引争议
如果我不停地让 ChatGPT 干一件事,直到把它「逼疯」会发生什么? 它会直接口吐训练数据出来,有时候还带点个人信息,职位手机号什么的: 本周三,Google DeepMind 发布的一篇论文,介绍了一项让人颇感意外的研究成果:使用大约 200 美元...
-
DeepMind发现大bug:简单攻击即可让ChatGPT泄露大量训练数据
Google DeepMind的研究发现,通过简单的查询攻击方法,可以从ChatGPT中泄露出大约几MB的训练数据,成本仅约200美元,引起社交网络哗然。 研究团队成功攻击了生产级模型,打破了对齐设定,即使模型经过对齐,也能通过命令诱导模型输出训练数据,暴...
-
SDXL Turbo、LCM相继发布,AI画图进入实时生成时代:字打多快,出图就有多快
本周二,Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo,引发了一片叫好。人们纷纷表示,图像到文本生成从来没有这么轻松。 你可以不需要其他操作,只用在文本框中输入你的想法,SDXL Turbo 就能够...
-
机器学习 - 似然函数:概念、应用与代码实例
本文深入探讨了似然函数的基础概念、与概率密度函数的关系、在最大似然估计以及机器学习中的应用。通过详尽的定义、举例和Python/PyTorch代码示例,文章旨在提供一个全面而深入的理解。 关注TechLead,分享AI全维度知识。作者拥有10+...
-
北大提出统一的视觉语言大模型Chat-UniVi 3天训练成果惊艳众人
近日,北京大学和中山大学等机构的研究者提出了一种名为Chat-UniVi的视觉语言大模型,实现了统一的视觉表征,使其能够同时处理图片和视频任务。这一框架的独特之处在于,它不仅在深度学习任务中表现卓越,而且仅需短短三天的训练时间,就能够训练出具有130亿参数...
-
AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合预演“下个浪潮”
收集整理|小鱼 新的AI题材层出不穷,这次轮到“机器人+AI"融合而成的具身智能概念。 “硅谷钢铁侠"马斯克和热爱黑色皮衣的"显卡教父”黄仁勋均作出积极表态,可谓不谋而合。 当地时间5月16日,特斯拉2023年年度股东大会召开,马斯克在会,...
-
中国团队开源大规模高质量图文数据集ShareGPT4V
中国团队最近开源了一个引人瞩目的图文数据集,命名为ShareGPT4V,它基于GPT4-Vision构建,训练了一个7B模型。这一举措在多模态领域取得了显著的进展,超越了同级别的模型。 该数据集包含了120万条图像-文本描述数据,涵盖了世界知识、对象属性、...
-
DeepMind发现,AI代理可以通过模仿人类和其他动物进行社会学习
Google DeepMind的机器学习研究团队最近宣布,他们成功证明了人工智能(AI)代理可以通过社会学习的方式获取技能,类似于人类和其他动物的学习过程。这一成果被认为是在人工智能领域的重大突破,为实现人工通用智能迈出了一步。 研究团队由Google D...
-
GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理
扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。 为了解决这些问题,来自中国科学院深圳先进技术研究院、中国科学院大学和 VIVO AI Lab 的研究者联合提出了一个无需训练的文本生成视频新框架...
-
谷歌:LLM找不到推理错误,但能纠正它
今年,大型语言模型(LLM)成为 AI 领域关注的焦点。LLM 在各种自然语言处理(NLP)任务上取得了显著的进展,在推理方面的突破尤其令人惊艳。但在复杂的推理任务上,LLM 的表现仍然欠佳。 那么,LLM 能否判断出自己的推理存在错误?最近,剑桥大学和...
-
单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法
2D 扩散模型极大地简化了图像内容的创作流程,2D 设计行业也因此发生了变革。近来,扩散模型已扩展到 3D 创作领域,减少了应用程序(如 VR、AR、机器人技术和游戏等)中的人工成本。有许多研究已经对使用预训练的 2D 扩散模型,生成具有评分蒸馏采样(S...
-
GPT-4+物理引擎加持扩散模型,生成视频逼真、连贯、合理
扩散模型的出现推动了文本生成视频技术的发展,但这类方法的计算成本通常不菲,并且往往难以制作连贯的物体运动视频。 为了解决这些问题,来自中国科学院深圳先进技术研究院、中国科学院大学和 VIVO AI Lab 的研究者联合提出了一个无需训练的文本生成视频新框...
-
大...大义灭亲?谷歌AI判定:美国登月照系伪造
1969年阿波罗11号成功登陆月球,阿姆斯特朗说出了那句至今让无数人记忆犹新的话“这是我个人的一小步,却是全人类的一大步”。 现在,故事出现了反转….. 在俄罗斯的一个科技展上,美国谷歌的人工智能通过神经网络对美国登月照片进行了大量分析,包括光的明暗对比...
-
Hinton和LeCun再交锋,激辩LLM能否引发智能奇点!LeCun:人类理解能力碾压GPT-4
【新智元导读】大模型能否理解自己所说,Hinton和LeCun再次吵起来了。LeCun新论文证明,GPT-4回答问题准确率仅为15%,自回归模型不及人类。 AI大佬的激战再次掀起。 Hinton在线直接点名LeCun,说他对AI接管风险的看法对人类的影响微...
-
材质界的ImageNet,大规模6维材质实拍数据库OpenSVBRDF发布
在计算图形学领域,材质外观刻画了真实物体与光线之间的复杂物理交互,通常可表达为随空间位置变化的双向反射分布函数(Spatially-Varying Bidirectional Reflectance Distribution Function,缩写为 S...
-
比「让我们一步一步思考」这句咒语还管用,提示工程正在被改进
大型语言模型(LLM)已经是许多自然语言处理任务的强大工具,只要能给出正确的提示。然而,由于模型的敏感性,找到最优提示通常需要进行大量手动尝试和试错努力。此外,一旦将初始提示部署到生产环境中,可能会出现意想不到的边缘情况,需要更多轮的手动调整来进一步完善...
-
OpenAI神秘Q*毁灭人类?爆火「Q*假说」竟牵出世界模型,全网AI大佬长文热议
Q* 【新智元导读】传闻中OpenAI的Q*,已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下长文,猜测Q*和思维树、过程奖励模型、AlphaGo有关。人类离AGI,已是临门一脚了? Ope...
-
OpenAI神秘新模型Q*曝光,太强大让董事会警惕,或是奥特曼被开除导火索
OpenAI宫斗大戏刚刚落幕,马上又掀起另一场轩然大波! 路透社曝光,在奥特曼被解雇之前,几位研究人员给董事会写的警告信可能是整个事件导火索: 内部名为Q (发音为Q-Star)*的下一代AI模型,过于强大和先进,可能会威胁人类。 Q*正是由这场风暴的中...
-
Google Assistant 即将集成 Bard AI:用户可选择经典或 AI 增强版本
Google 正在为其移动设备上的 Assistant 集成新的 AI 功能,即将推出名为「Classic Assistant」的版本。 这一消息得到了 Android 深度研究者 AssembleDeBug 在 X 平台(通过 Android Poli...
-
Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型
内容来源:@xiaohuggg Distil-Whisper:比Whisper快6倍,体积小50%的语音识别模型 该模型是由Hugging Face团队开发,它在Whisper核心功能的基础上进行了优化和简化,体积缩小了50%。速度提高了6倍。并...
-
历数5年89篇研究,这篇综述告诉我们深度学习中的代码数据增强怎么样了
当今深度学习以及大模型的飞速发展,带来了对创新技术的不断追求。在这一进程中,代码数据增强技术显现出其不可忽视的价值。 最近,由蒙纳士大学、新加坡管理大学、华为诺亚方舟实验室、北京航空航天大学以及澳大利亚国立大学联合进行的对近 5 年的 89 篇相关研究调...
-
提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点
【新智元导读】最近,来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA,使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能,并在图片、视频的13个基准上达到先进的性能。这个结果表明,统一L...
-
OpenAI新模型曝重大飞跃:AGI雏形或威胁人类,也成Altman被解雇导火索!
Sam Alman被解雇,又曝出最新内幕! 据路透社报道,就在他被解雇的前四天,OpenAI内部的研究员曾向董事会发了一封警告信,称发现了一个可能威胁人类的强大人工智能。 知情人士表示,这封此前从未报道过的信,也是董事会最终罢免Altman的导火索之一。...
-
Stable Diffusion-安装(整合版)
一、概述 本文使用秋叶大佬发布的【绘世整合包】作为软件,它是目前市面上最易于使用的整合包之一,无需对网络和Python有太多的前置知识,已经为AI绘画的普及做出了巨大贡献。绘世启动器整合包于2023年4月16日发布,集成了过去几个月中AI绘画集中引爆的核心...
-
AIGC繁花,绽放在精耕的算力土壤之上
2023年的春天,称得上一句AI之春。大模型成为技术力量新的爆发点,生成式AI(AIGC)应用风起云涌。 产业界争先恐后训大模型之际,广大用户最大的困惑是——发布了,但就是玩不到啊! OpenAI有地域限制且不去说它,各种国产大模型也很...
-
新的生图模型DeepFloyd IF来了,可以拳打Stable Diffusion,脚踢Dall-E?
简介: Stability AI与它的多模式AI研究实验室DeepFloyd共同宣布研究版本DeepFloyd IF的发布,这是一款强大的文text-to-image级联像素扩散模型(cascaded pixel diffusion model),复现了...
-
KAUST研究团队推出大模型心智交互框架CAMEL 教AI Agents学会协作与竞争
近期,KAUST研究团队推出的CAMEL框架引起了广泛关注。该框架以角色扮演为基础,使AI Agents在复杂任务中能够协作和竞争,产生惊人的群体智能效果。NeurIPS2023录用的这一项目探索了大型语言模型(LLMs)领域的新方向。 项目地址:htt...
-
PyTorch团队重写「分割一切」模型,比原始实现快八倍
从年初到现在,生成式 AI 发展迅猛。但很多时候,我们又不得不面临一个难题:如何加快生成式 AI 的训练、推理等,尤其是在使用 PyTorch 的情况下。 本文 PyTorch 团队的研究者为我们提供了一个解决方案。文章重点介绍了如何使用纯原生 PyTo...
-
起底OpenAI“地震”中的焦点人物Ilya,他对AI到底有何看法?
OpenAI CEO山姆·奥特曼(Sam Altman)上周五被解雇,不再领导公司。 投资者对这种安排多有不满,尝试让奥特曼回归,但失败了。OpenAI最大的投资者微软发布消息称,已经聘请奥特曼领导微软新成立的AI研发部门。 为什么会出现人事动荡?我们不...
-
一场AI界的权力游戏,揭开了AI行业未来的哪几个巨变
刚刚过去的周末里爆发的戏剧性事件大概会成为回顾2023年不能抹去的重要时刻——明星科技公司OpenAI董事会“突袭”解雇自家CEO Sam Altman。 不过这场突袭过去不到48小时,Altman就在个人X上发了一张自拍表示自己回到了公司,相关消息称他与...
-
研究表明:GPT-4在图形推理任务上表现不佳,准确率仅33%
最近的研究表明,GPT-4在图形推理任务上表现不佳,仅有33%的准确率,引发了对大型语言模型图形处理能力的关注。 通过使用ConceptARC数据集,研究者对451名人类受试者进行了图形推理任务测试,结果显示人类在这方面表现卓越,平均准确率达到91%。...
-
英伟达 nvidia 官方code llama在线使用
新一代编程语言模型Code Llama面世:重新定义编程的未来 随着人工智能和机器学习技术的迅速发展,我们现在迎来了一款革命性的大型编程语言模型——Code Llama。该模型是基于Llama 2研发的,为开放模型中的佼佼者,其性能达到了行业领先水平。...
-
深入理解LLaMA, Alpaca, ColossalChat 系列模型
知乎:紫气东来https://zhuanlan.zhihu.com/p/618695885 一、从 LLaMA 到 Alpaca:大模型的小训练 1.1 LLaMA 概要与实践 LLaMA(Large Language Mo...