-
ChatGPT上新文件分析、自动搜索等功能,初创公司的产品被取代?
最近,OpenAI 为 ChatGPT Plus 会员推出了新的测试版功能,主要包括上传和分析文件,支持多模态,并且系统会根据上下文自动选择是否使用必应浏览器、数据分析工具、DALL·E,而无需用户手动切换。 将文件输入到 ChatGPT 后,系统需要...
-
ChatGPT再进化,全工具All in One,网友:多少创业项目死于今天
一夜之间ChatGPT悄悄大更新,一众创业项目要被创飞了! 现在,它不仅支持上传PDF等各种你想分析的文件。 还能在一个对话里,自动切换使用各种工具,Dall·E、浏览器、数据分析等能一条龙使用了。 这一更新,让不少人惊呼:许多创业项目死于今天。 英伟...
-
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟
视觉幻觉是常见于多模态大语言模型(Multimodal Large Language Models, MLLMs)的一个典型问题。 简单来说就是:模型输出的描述与图片内容不相符。 下图中体现了两种幻觉,红色部分错误地描述了狗的颜色(属性幻觉),蓝色部分描...
-
北大团队:诱导大模型“幻觉”只需一串乱码!大小羊驼全中招
北大团队最新研究发现: 随机token都能诱发大模型出现幻觉! 比如喂给大模型(Vicuna-7B)一段“乱码”,它就莫名其妙弄错了历史常识。 或者是简单修改提示词,大模型也会掉入陷阱。 Baichuan2-7B、InternLM-7B、ChatGL...
-
为何GPT-4P容易受到多模态提示注入图像攻击?
OpenAI新的GPT-4V版本支持图像上传后,带来了一条全新的攻击途径,使大型语言模型(LLM)容易受到多模态注入图像攻击。攻击者可以在图像中嵌入命令、恶意脚本和代码,随后模型会遵从行事。 多模态提示注入图像攻击可以泄露数据、重定向查询、生成错误信息,...
-
重磅!GPT-4又进化了!画图、插件、代码等能力被整合,超级智能体来了
夕小瑶科技说 原创 作者 | 小戏、ZenMoore 就在今天!OpenAI 闷声放了一个大招! 图片 还没有官宣,还没有发布会,也没有大肆报道与关注。OpenAI 这次仅仅以灰度测试的方式,给部分用户发布了一个可以说“整合了几乎所有可用工具”的完全版...
-
更高清写实的人体生成模型HyperHuman来了,基于隐式结构扩散,刷新多项SOTA
论文地址: https://arxiv.org/pdf/2310.08579.pdf Github 地址: https://github.com/snap-research/HyperHuman 1. 研究背景与动机 随着扩散模型的兴起,一些典型...
-
AI智能超越人类终解开!李飞飞高徒新作破圈,5万个合成数据碾压人类示例,备咖啡动作超丝滑
AI巨佬Geoffrey Hinton称,「科技公司们正在未来18个月内,要使用比现在GPT-4多100倍的算力训练新模型」。 更大参数的模型,对算力需求巨大的同时,对数据也提出了更高的要求。 但是,更多的高质量数据该从何来? 英伟达高级科学家Jim F...
-
GPT4教机器人盘转笔,那叫一个丝滑!
那个在聊天中给数学家陶哲轩带来启发的GPT-4,最近又开始教机器人转笔了。 项目叫Agent Eureka,是由英伟达、宾州大学、加州理工学院和得克萨斯大学奥斯汀分校联手研发的。他们的研究结合了 GPT-4 结构的能力和强化学习的优势,让 Eureka...
-
AI视野:OpenAI成全球第三最有价值初创公司;SDXL推精简版本;小米14将搭载WPS AI功能;Bing AI拒绝生成女性逼真图像
???AI应用 SDXL推精简版本SSD-1B 推理速度提升60% Segmind Stable Diffusion1B(SSD-1B)是一款高效、高速的文本生成图像AI模型,为图像生成提供广泛可能性,它是稳定扩散XL的精简版本,体积减小50%,但速度提升...
-
DeepMind:谁说卷积网络不如ViT?
深度学习的早期成功可归功于卷积神经网络(ConvNets)的发展。近十年来,ConvNets 主导了计算机视觉基准测试。然而近年来,它们越来越多地被 ViTs(Vision Transformers)所取代。 很多人认为,ConvNets 在小型或中等规...
-
RLHF与AlphaGo核心技术强强联合,UW/Meta让文本生成能力再上新台阶
在一项最新的研究中,来自 UW 和 Meta 的研究者提出了一种新的解码算法,将 AlphaGo 采用的蒙特卡洛树搜索算法(Monte-Carlo Tree Search, MCTS)应用到经过近端策略优化(Proximal Policy Optimiz...
-
GraphAlign:通过图匹配增强多模态3D目标检测的准确特征对齐
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:GraphAlign: Enhancing Accurate Feature Alignment by Graph matching for Multi-Modal 3D Object Det...
-
用于自动驾驶赛车的多模态传感器融合和目标跟踪
本文经自动驾驶之心公众号授权转载,转载请联系出处。 原标题:Multi-Modal Sensor Fusion and Object Tracking for Autonomous Racing 论文链接:https://arxiv.org/pdf/23...
-
AI视野:高通发布骁龙X Elite芯片;AutoGPT获1200万美元融资;AI社交产品Airchat火了;百度Comate智能代码助手上线SaaS版本
???AI新鲜事 高通发布骁龙X Elite芯片 电脑可运行130亿参数大模型 高通发布骁龙X Elite芯片,成为全球性能最强的CPU,能在PC上运行130亿参数的大模型,实现离线AI应用。 爆火智能体项目AutoGPT获1200万美元融资 Auto...
-
LeCun又双叒唱衰自回归LLM:GPT-4的推理能力非常有限,有两篇论文为证
「任何认为自动回归式 LLM 已经接近人类水平的 AI,或者仅仅需要扩大规模就能达到人类水平的人,都必须读一读这个。AR-LLM 的推理和规划能力非常有限,要解决这个问题,并不是把它们变大、用更多数据进行训练就能解决的。」 一直以来,图灵奖得主 Yan...
-
北大数学课引入AI助教Brainiac Buddy 基于GPT-4开发
北大数学课引入AI助教,为学生和老师提供更好的学习和教学体验。这个AI助教名为Brainiac Buddy,基于GPT-4开发,能够帮助学生理解课程内容,解答问题,以及提供学习支持。董彬是这个AI助教的创始人,他是北京国际数学研究中心教授兼国际机器学习研究...
-
Bengio、Hinton、张亚勤等AI大佬再发联名信!AI太危险,我们需要重新定位
AI风险管理,再度被AI大佬提上了日程。 就在刚刚,一封由Bengio、Hinton、姚期智(Andrew Yao)、张亚勤等知名专家签署的联名信引起了许多人的关注。 这篇题为「在快速发展的时代管理人工智能风险」的文章,也即将发表在arXiv上。 有...
-
多模态神经网络SALMONN 能够理解声音世界的AI模型
SALMONN是一个多模态神经网络,能够直接处理和理解包括语音、音频事件和音乐在内的一般音频输入,并在多种语音和音频任务上取得竞争性表现。 论文地址:https://arxiv.org/pdf/2310.13289v1.pdf SALMONN采用了两个互...
-
UniPAD:自动驾驶通用预训练范式来了!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 UNIPAD:自动驾驶通用预训练范式 原标题:UNIPAD: A UNIVERSAL PRE-TRAINING PARADIGM FOR AUTONOMOUS DRIVING 论文链接:https:/...
-
GPT-4教会机器手转笔、玩魔方!RL社区震惊:LLM设计奖励竟能超越人类?
GPT-4,竟然教会机器人转笔了! 图片 英伟达、宾大、加州理工、德州奥斯汀等机构的专家提出一个开放式Agent——Eureka,它是一个开放式Agent,为超人类水平的机器人灵巧性设计了奖励功能。 图片 论文链接:https://arxiv.org/p...
-
解读OpenAI最强文生图模型—DALL·E 3
Midjourney、Stable Difusion在商业变现和场景化落地方面获得了巨大成功,这让OpenAI看到了全新的商机,也是推出DALL·E3的重要原因之一。 上周,OpenAI宣布在ChatGPT Plus和企业版用户中,全面开放文生图模型DAL...
-
让AI帮你跳槽,涨薪50% 不是问题
这篇文章将教你使用 AI 打磨一份几乎完美的简历;教你用 AI 模拟面试场景,遍历所有面试问题,让你在面试时游刃有余。 关键信息:协助回顾职业履历;根据履历生成简历;根据岗位要求优化简历;模拟招聘方优化简历;构建“智能体”模拟面试遍历问题。 本文适合下列人...
-
插件:门槛最低的AI另类原生应用
10月17日,在“2023百度世界大会”上,李彦宏正式发布了最新的文心大模型4.0版本。 一时间,各种测评纷涌而至,各大科技媒体从理解、生成、逻辑和记忆能力等方面,对模型进行了全方位测评。 然而,除了被人反复谈论的文心4.0之外,在发布会上,另一个稍显低调...
-
HiLM-D:自动驾驶多模态大语言模型玩出花了
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者个人的一些思考 不得不说,最近大模型在学术界火起来了,基于图文匹配的CLIP预训练模型成为近年来在多模态研究领域的经典之作。除此之外,大语言模型的蓬勃发展也进一步为多模态带来了性能提升。自动驾驶领...
-
ChatDOC:一个基于ChatGPT的文件阅读助手
ChatDOC是一个可以快速从文档中提取、定位和总结信息的文件阅读助手,能够理解文本、表格和图像。ChatDOC可以帮助用户从各种格式的文档中获取所需的信息,如.pdf, .doc, .docx, .md, .epub, .txt, 网站, 扫描文件等。...
-
全新视觉提示方法SoM 让GPT-4V看的更准、分的更细
研究人员推出了一种新的视觉提示方法 Set-of-Mark(SoM),它可以让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。GPT-4V 是一种基于 GPT-4的多模态模型,可以同时处理文本和图像,并生成多种类型的输出。 然而...
-
AI视野:WPS AI宣布接入WPS Mac版;爱奇艺推出AI搜索;苹果计划明年推出生成式AI功能;DALL-E3易受越狱攻击
???AI应用 爱奇艺推出AI搜索 将生成式AI技术应用于剧情搜索等场景 爱奇艺升级AI搜索,区别于传统搜索第一步只能搜到片名,升级后的爱奇艺AI搜索主打让观众在搜索环节便能一键直达心仪内容。 WPS AI 宣布接入 WPS Mac 版 提供内容生成等功...
-
在视觉提示中加入「标记」,微软等让GPT-4V看的更准、分的更细
最近一段时间,我们见证了大型语言模型(LLM)的显著进步。特别是,生成式预训练 Transformer 或 GPT 的发布引领了业界和学术界的多项突破。自 GPT-4发布以来,大型多模态模型 (LMM 引起了研究界越来越多的兴趣,许多工作致力于构建多模态...
-
机器人学会转笔、盘核桃了!GPT-4加持,任务越复杂,表现越优秀
大数据文摘出品 家人们,继人工智能(AI)攻占象棋、围棋、Dota之后,转笔这一技能也被 AI 机器人学会了。 上面这个笔转的贼溜的机器人,得益于名叫Eureka的智能体(Agent),是来自英伟达、宾夕法尼亚大学、加州理工学院和得克萨斯大学奥斯汀分...
-
有了GPT-4之后,机器人把转笔、盘核桃都学会了
在学习方面,GPT-4 是一个厉害的学生。在消化了大量人类数据后,它掌握了各门知识,甚至在聊天中能给数学家陶哲轩带来启发。 与此同时,它也成为了一名优秀的老师,而且不光是教书本知识,还能教机器人转笔。 这个机器人名叫 Eureka,是来自英伟达、宾夕法...
-
参数少近一半,性能逼近谷歌Minerva,又一个数学大模型开源了
如今,在各种文本混合数据上训练出来的语言模型会显示出非常通用的语言理解和生成能力,可以作为基础模型适应各种应用。开放式对话或指令跟踪等应用要求在整个自然文本分布中实现均衡的性能,因此更倾向于通用模型。 不过如果想要在某一领域(如医学、金融或科学)内最大限...
-
斯坦福公开十大主流模型透明度!Llama 2位列第一,GPT-4透明差,LeCun炮轰:盈利完全理解
GPT-4、Llama等基础模型(FM)相继诞生,已成为当前生成式AI的引擎。 尽管这些FM的社会影响力不断增大,但透明度反而下降。 GPT-4官宣后,OpenAI公布的技术报告中,并未提及关键信息。包括谷歌PaLM,以及其他闭源模型也是如此。 每个人...