-
世界模型和DriveGPT这类大模型到底能给自动驾驶带来什么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 大模型今年爆火,很多领域上的应用如雨后春笋般涌现,很多优秀的工作出现,主要集中在数据生成和场景分析表述两部分,重点解决自动驾驶的长尾分布问题和场景识别。今天自动驾驶之心带大家梳理下自动驾驶行业上的大模...
-
龙与地下城:大模型文字游戏之路
作者 | 崔皓 审校 | 重楼 摘要 本文作者受到一位国外博主的启发,决定尝试使用大语言模型创建一个地下城文字游戏。通过大语言模型生成富有创意和连贯性的游戏内容。他的游戏灵感主要来源于经典的桌面角色扮演游戏“龙与地下城”(D&D)。该游戏通过对话...
-
更高清写实的人体生成模型HyperHuman来了,基于隐式结构扩散,刷新多项SOTA
论文地址: https://arxiv.org/pdf/2310.08579.pdf Github 地址: https://github.com/snap-research/HyperHuman 1. 研究背景与动机 随着扩散模型的兴起,一些典型...
-
Agent 应用于提示工程
如果Agent模仿了人类在现实世界中的操作方式,那么,能否应用于提示工程即Prompt Engingeering 呢? 从LLM到Prompt Engineering 大型语言模型(LLM 是一种基于Transformer的模型,已经在一个巨大的语料库或...
-
谷歌 Bard 聊天机器人升级,可实时生成回复
10 月 29 日消息,大型语言模型(LLMs)并不是瞬间就能给出答案的,所以在输入问题和得到回答之间会有一段延迟。必应聊天提供回答的方式是在回答完全生成前逐行显示一部分回复,而谷歌 Bard 则是回答完全生成后一次性显示全部回复,不过现在谷歌 Ba...
-
GPT4教机器人盘转笔,那叫一个丝滑!
那个在聊天中给数学家陶哲轩带来启发的GPT-4,最近又开始教机器人转笔了。 项目叫Agent Eureka,是由英伟达、宾州大学、加州理工学院和得克萨斯大学奥斯汀分校联手研发的。他们的研究结合了 GPT-4 结构的能力和强化学习的优势,让 Eureka...
-
新研究:鸽子解决问题的方式类似于人工智能
一项由美国俄亥俄州立大学和爱荷华大学的研究人员进行的研究发现,鸽子在解决问题时使用了一种类似于人工智能的“暴力算法”方法。 俄亥俄州立大学的心理学教授布兰登・特纳说,研究人员发现“有非常强的证据表明,鸽子的学习机制与现代机器学习和人工智能技术的原理相似...
-
多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生
还在用指令微调解决多模态大模型的“幻觉”问题吗? 比如下图中模型将橙色柯基错认为“红狗”,还指出周围还有几条。 图片 现在,中科大的一项研究想到了一个全新办法: 一个免重训、即插即用的通用架构,直接从模型给出的错误文本下手,“倒推”出可能出现“幻觉”之处...
-
英国消费者组织警告:AI 聊天机器人使网络诈骗文案愈发专业化
10 月 28 日消息,根据英国消费者组织 Which? 当地时间周五公布的最新发现,不法分子会利用 ChatGPT 和 Bard 等 AI 聊天机器人制造出更有说服力的骗局,对公众构成威胁,且上述聊天机器人缺乏有效的防御措施。 据介绍,当地消费者通...
-
小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大
大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能,但是由于训练和推理大参数量模型需要大量的计算资源,导致高昂的成本,将大语言模型应用在专业领域中仍存在诸多现实问题。因此,北理团队先从轻量级别模型入手,最大程度发挥数据和模型的优势,立足更...
-
港大等发布GraphGPT:1/50微调参数,准确率提升10倍!无需超长token,LLM也能读懂图结构
图神经网络(Graph Neural Networks)已经成为分析和学习图结构数据的强大框架,推动了社交网络分析、推荐系统和生物网络分析等多个领域的进步。 图神经网络的主要优势在于它们能够捕获图数据中固有的结构信息和依赖关系。利用消息传递和聚合机制,图...
-
陶哲轩论文漏洞竟被AI发现,,看定理名猜出研究方向,大神直呼AI能力惊人
最近,热衷于用GPT-4、Copilot做研究的数学大神陶哲轩,又在AI的帮助下发现了自己论文中的一处隐藏bug! 陶哲轩表示,自己在用Lean4形式化第6页论点的过程中发现,表达式在n=3,k=2时,实际上是发散的。 这个不太容易看出的bug能被及时...
-
OpenAI 设立安全团队 Preparedness:评估 AI 风险、防止外界滥用
10 月 27 日消息,OpenAI 今日宣布,正建立 Preparedness 团队来评估通用 AI(Artificial General Intelligence,AGI)可能造成的灾难性风险,该团队交由麻省理工学院(MIT)的可部署机器学习中...
-
一句话让 AI 开发 App,微软正式宣布为 Power Platform 平台推出 Copilot 服务
10 月 27 日消息,微软日前在企业应用大会上,正式宣布将向旗下低代码平台 Power Platform 逐步推出 Copilot AI。 据悉,相关功能预计将在 2023 年 10 月到 2024 年 3 月逐步部署,Power Pages、Po...
-
波士顿动力推出 AI 集成的机器人狗 Spot:打造未来互动导游
波士顿动力公司近日推出了其新一代机器人狗 Spot,这是一种配备了聊天机器人技术的智能导游机器人。Spot 不仅能走动和交谈,还能以其独特的英国口音为游客提供场所导游服务。通过与 ChatGPT 及其他开源大型语言模型(LLMs)的集成,Spot 能够精准...
-
RLHF与AlphaGo核心技术强强联合,UW/Meta让文本生成能力再上新台阶
在一项最新的研究中,来自 UW 和 Meta 的研究者提出了一种新的解码算法,将 AlphaGo 采用的蒙特卡洛树搜索算法(Monte-Carlo Tree Search, MCTS)应用到经过近端策略优化(Proximal Policy Optimiz...
-
ChatGPT企业版,基本凉了!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) OpenAI 财报发布了,年化营收达到了13亿美元,平均每月营收超1亿美元,但或许创始人 Sam Altman,高兴不起来。 因为,大部分收入的信心还是用户端。据现在客户的反馈看,...
-
用检索增强生成技术解决人工智能幻觉问题
作者| Rahul Pradhan 来源| https://www.infoworld.com/article/3708254/addressing-ai-hallucinations-with-retrieval-augmented-generatio...
-
利用 ChatGPT 等大模型训练,波士顿动力将 Spot 机器狗变成“会说话的导游”
▲ 图源波士顿动力公司 YouTube 视频截图 10 月 27 日消息,波士顿动力公司于数小时前在其官方 YouTube 频道上传了一段视频,展示了波士顿动力机器狗的“语言能力”。视频中,波士顿动力机器狗化身“导游”带领工作人员参观自家公司的各种设施。...
-
Datasaur推出LLM实验室,助力企业构建自定义AI应用
San Francisco的AI初创公司Datasaur宣布推出LLM Lab,这是一款全面的工具,旨在帮助企业构建自定义的大型语言模型应用,类似于ChatGPT。LLM Lab可在云端或本地部署,为企业提供构建内部自定义生成式AI应用的起点,同时减少了来...
-
35年首次证明,NYU重磅发现登Nature:神经网络具有类人泛化能力,举一反三超GPT-4
【新智元导读】Nature刊登了纽约大学等机构的研究人员在人工智能领域最新突破,证明神经网络具有类似人类语言的泛化性能,再一次印证了AI发展的无限潜力! 35年来,认知科学、人工智能、语言学和哲学领域的研究人员一直在争论神经网络是否能实现类似人类的系统泛...
-
联合国成立 AI 咨询机构,为国际社会加强治理提供支持
10 月 27 日消息,当地时间 10 月 26 日,联合国秘书长安东尼奥・古特雷斯宣布成立一个新的人工智能(AI)咨询机构,将为国际社会加强对 AI 的治理提供支持。 古特雷斯表示,当前 AI 具有难以把握的变革潜力,若 AI 被恶意使用,可能导致...
-
35年首次证明!NYU重磅发现登Nature:神经网络具有类人泛化能力,举一反三超GPT-4
35年来,认知科学、人工智能、语言学和哲学领域的研究人员一直在争论神经网络是否能实现类似人类的系统泛化。 具体来说,人们一直认为,AI无法像人类一样具有「系统泛化(systematic generalization)」能力,不能对没有经过训练的知识做到「...
-
DataStax集成LangChain,简化生成式AI应用程序的创建
DataStax是一家专注于实时人工智能的公司,宣布将LangChain整合到其Astra DB矢量数据库中。这一整合的目标是使开发者更容易创建生成式AI应用程序,从而鼓励企业积极参与生成式AI革命。通过与LangChain的整合,开发者可以轻松将Astr...
-
生成式人工智能如何重新定义图像搜索
译者 | 李睿 审校 | 重楼 近几个月来,生成式人工智能凭借其创造独特的文本、声音和图像的能力引起了人们的极大兴趣。但生成式人工智能的力量并不局限于创造新的数据。 生成式人工智能的底层技术(例如Transformer和扩散模型)可以为许多其他应用提供...
-
纳德拉出席高通骁龙峰会,称 Copilot 将成为下个 Windows 开始按钮
10 月 26 日消息,高通在昨日开幕的骁龙峰会上,正式推出了 X Elite 处理器,并公布了 9 家首批合作伙伴。 在本次活动中,微软现任首席执行官萨蒂亚・纳德拉(Satya Nadella)、Windows + Devices 部门副总裁帕万・达...
-
微软 CEO 纳德拉称 AI 诞生堪比原子能,需要展开全球治理
10 月 26 日消息,微软现任首席执行官萨蒂亚・纳德拉(Satya Nadella)认为,人工智能(AI)的出现不亚于原子弹,呼吁全球加强监管。 纳德拉近日前往 Axel Springer 总部,领取 2023 年 Axel Springer 奖,在...
-
AI视野:高通发布骁龙X Elite芯片;AutoGPT获1200万美元融资;AI社交产品Airchat火了;百度Comate智能代码助手上线SaaS版本
???AI新鲜事 高通发布骁龙X Elite芯片 电脑可运行130亿参数大模型 高通发布骁龙X Elite芯片,成为全球性能最强的CPU,能在PC上运行130亿参数的大模型,实现离线AI应用。 爆火智能体项目AutoGPT获1200万美元融资 Auto...
-
可令 AI 模型“输入狗生成猫”,黑客展示为训练数据集“下毒”的 Nightshade 工具
10 月 25 日消息,AI 大模型训练数据源版权问题一直是一个令业界头疼的问题,日前有黑客展示了一款名为 Nightshade 的工具,该工具可在不破坏观感的情况下轻微修改图片,若有 AI 模型在训练时使用了这些被“下毒”的图片,模型生图结果便会被毁...
-
Anthropic AI 团队研究显示:人工智能倾向于产生迎合用户的奉承性回应而非事实真相
Anthropic 是一家美国的人工智能初创企业和公益公司,由 OpenAI 的前成员创立。Anthropic 专注于开发通用 AI 系统和语言模型,并秉持负责任的 AI 使用理念。Anthropic 开发的 Claude 2 于 2023 年七月推出。...
-
LeCun又双叒唱衰自回归LLM:GPT-4的推理能力非常有限,有两篇论文为证
「任何认为自动回归式 LLM 已经接近人类水平的 AI,或者仅仅需要扩大规模就能达到人类水平的人,都必须读一读这个。AR-LLM 的推理和规划能力非常有限,要解决这个问题,并不是把它们变大、用更多数据进行训练就能解决的。」 一直以来,图灵奖得主 Yan...
-
LLM一句话瞬间生成3D世界,未公布代码已获141星!或将引发3D建模行业革命
继火爆全网的AI文生图,文生视频之后,文生3D场景的技术也来了! 只要不到30个字的提示词,瞬间就能生成这样的3D场景。 场景效果和文字的要求几乎分毫不差——「平静如玻璃的湖面,倒映出无云的天空,周围的山和水鸟的倒影呈现在湖中。」 「烈日照耀在无垠...
-
最高20倍!压缩ChatGPT等模型文本提示,极大节省AI算力
在长文本场景中,ChatGPT等大语言模型经常面临更高算力成本、更长的延迟以及更差的性能。为了解决这三大难题,微软开源了LongLLMLingua。 据悉,LongLLMLingua的核心技术原理是将“文本提示”实现最高20倍的极限压缩,同时又可以准确评估...
-
微软更新 Skype 应用:改进通话界面、优化相机体验、增强必应聊天
10 月 25 日消息,微软近日更新了 iOS 和安卓版 Skype 应用,邀请 Skype Insider 项目成员,测试安装 Build 8.106.76.206。本次版本更新重点改善了通话界面,优化了相机体验,修复了多处错误。 IT之家在此附上...
-
ChatGPT与DALL·E 3之间的行业「黑话」被人发现了
上个月底,OpenAI 发布了最新图像生成器 DALL・E 3,除了炸裂的生成效果外,最大看点是其与 ChatGPT 的集成。 DALL・E 3 构建在 ChatGPT 之上,用 ChatGPT 来创建、拓展和优化 prompt。这样一来,用户无需在 p...
-
IBM 推出 AI 芯片 NorthPole:内置存储器,号称可“模拟人脑运行”
▲ 图源 IBM 10 月 24 日消息,IBM Research 日前推出 AI 芯片 NorthPole,该芯片灵感号称“来自人类大脑的运作”,推论性能据称超越 4nm GPU,适用于边缘计算等范畴。 IT之家经过查询得知,NorthPole 芯片是...
-
你的GPU能跑Llama 2等大模型吗?用这个开源项目上手测一测
在算力为王的时代,你的 GPU 可以顺畅的运行大模型(LLM)吗? 对于这一问题,很多人都难以给出确切的回答,不知该如何计算 GPU 内存。因为查看 GPU 可以处理哪些 LLM 并不像查看模型大小那么容易,在推理期间(KV 缓存)模型会占用大量内存,例...
-
Meta普林斯顿提出LLM上下文终极解决方案!让模型化身自主智能体,自行读取上下文节点树
到底什么才是LLM长上下文模型的终极解决方案? 最近由普林斯顿大学和Meta AI的研究者提出了一种解决方案,将LLM视为一个交互式智能体,让它决定如何通过迭代提示来读取文本。 论文地址:https://arxiv.org/abs/2310.05029...
-
GPT-4教会机器手转笔、玩魔方!RL社区震惊:LLM设计奖励竟能超越人类?
GPT-4,竟然教会机器人转笔了! 图片 英伟达、宾大、加州理工、德州奥斯汀等机构的专家提出一个开放式Agent——Eureka,它是一个开放式Agent,为超人类水平的机器人灵巧性设计了奖励功能。 图片 论文链接:https://arxiv.org/p...
-
国外科学家开发出“AI 中医”:舌诊系统看病准确率高达 94%
10 月 23 日消息,两千多年以来,中医就通过观察人们舌头的颜色和形状来诊断疾病,这种方法现在正在通过人工智能和机器学习技术得到增强。 伊拉克和澳大利亚研究人员之间的一项合作研究表明,计算机辅助舌头诊断系统可以准确识别 94% 的糖尿病和肾衰竭等疾病...
-
HiLM-D:自动驾驶多模态大语言模型玩出花了
本文经自动驾驶之心公众号授权转载,转载请联系出处。 笔者个人的一些思考 不得不说,最近大模型在学术界火起来了,基于图文匹配的CLIP预训练模型成为近年来在多模态研究领域的经典之作。除此之外,大语言模型的蓬勃发展也进一步为多模态带来了性能提升。自动驾驶领...
-
英国AI初创公司Harmonic获得700万美元资金
划重点: ? 英国初创公司Harmonic Security成功融资700万美元,旨在构建技术以保障企业生成式AI部署的安全性。 ? Harmonic将开发软件,应对未受监管的AI应用程序采集大规模公司数据的问题。 ? 投资由Ten Eleven Vent...
-
从基础到实践,回顾 Elasticsearch 向量检索发展史
1.引言 向量检索已经成为现代搜索和推荐系统的核心组件。 通过将复杂的对象(例如文本、图像或声音)转换为数值向量,并在多维空间中进行相似性搜索,它能够实现高效的查询匹配和推荐。 Elasticsearch 作为一款流行的开源搜索引擎,其在向量检索方面...
-
英伟达推出 AI 系统 Eureka,可令机器人执行转笔传球等复杂工作
10 月 23 日消息,英伟达日前公布了一个名为 Eureka 的 AI 系统,该系统以 OpenAI 的 GPT-4 为基础,能够让机器人执行例如“转笔”、“开抽屉”、“拿剪刀”、“双手互传球”等 30 多种复杂动作。 IT之家经过查询得知,英伟达研...
-
国外科学家开发出“AI 中医”:舌诊系统看病最高准确率达 94%
10 月 23 日消息,两千多年以来,中医就通过观察人们舌头的颜色和形状来诊断疾病,这种方法现在正在通过人工智能和机器学习技术得到增强。 伊拉克和澳大利亚研究人员之间的一项合作研究表明,计算机辅助舌头诊断系统可以准确识别 94% 的糖尿病和肾衰竭等疾病...
-
外媒:苹果计划每年投资10亿美元 将生成式AI整合到其产品线中
10月23日消息,据外媒报道,苹果公司计划每年投资10亿美元,将生成式人工智能(AI)整合到其产品线中。 随着OpenAI旗下AI聊天机器人ChatGPT和谷歌旗下AI聊天机器人Bard的兴起,几乎所有科技公司都努力在人工智能领域分一杯羹。 然而,与Ope...
-
AI视野:WPS AI宣布接入WPS Mac版;爱奇艺推出AI搜索;苹果计划明年推出生成式AI功能;DALL-E3易受越狱攻击
???AI应用 爱奇艺推出AI搜索 将生成式AI技术应用于剧情搜索等场景 爱奇艺升级AI搜索,区别于传统搜索第一步只能搜到片名,升级后的爱奇艺AI搜索主打让观众在搜索环节便能一键直达心仪内容。 WPS AI 宣布接入 WPS Mac 版 提供内容生成等功...
-
在视觉提示中加入「标记」,微软等让GPT-4V看的更准、分的更细
最近一段时间,我们见证了大型语言模型(LLM)的显著进步。特别是,生成式预训练 Transformer 或 GPT 的发布引领了业界和学术界的多项突破。自 GPT-4发布以来,大型多模态模型 (LMM 引起了研究界越来越多的兴趣,许多工作致力于构建多模态...
-
机器人学会转笔、盘核桃了!GPT-4加持,任务越复杂,表现越优秀
大数据文摘出品 家人们,继人工智能(AI)攻占象棋、围棋、Dota之后,转笔这一技能也被 AI 机器人学会了。 上面这个笔转的贼溜的机器人,得益于名叫Eureka的智能体(Agent),是来自英伟达、宾夕法尼亚大学、加州理工学院和得克萨斯大学奥斯汀分...
-
声音揭示健康秘密:新 AI 技术用六秒钟的录音即可诊断出 2 型糖尿病
10 月 22 日消息,一项新的研究发现,只要对着智能手机说几句话,就能用声音诊断出 2 型糖尿病。这项新技术结合了声音技术和人工智能,可以帮助发现数百万未被诊断的 2 型糖尿病患者。这项研究发表在《梅奥诊所进展:数字健康(Mayo Clinic...