-
激发大语言模型空间推理能力:思维可视化提示
大语言模型(LLMs)在语言理解和各种推理任务中展现出令人印象深刻的性能。然而,它们在人类认知的关键一面——空间推理上,仍然未被充分研究。人类具有通过一种被称为 心灵之眼 的过程创造看不见的物体和行为的心智图像的能力,从而使得对未见世界的想象成为可能。...
-
报告称:OpenAI和Meta即将发布具有人类推理能力的AI模型
OpenAI 和 Meta 据称正在准备发布更先进的 AI 模型,这些模型将能够帮助解决问题并承担更复杂的任务。OpenAI 的首席运营官 Brad Lightcap 告诉《金融时报》,公司下一个版本的 GPT 将在解决 "困难问题" 方面取得进展,例如推...
-
探索智能体的边界:AgentQuest,一个全面衡量和提升大型语言模型智能体性能的模块化基准框架
随着大模型的不断进化,LLM智能体——这些强大的算法实体已经展现出解决复杂多步骤推理任务的潜力。从自然语言处理到深度学习,LLM智能体正逐渐成为研究和工业界的焦点,它们不仅能够理解和生成人类语言,还能在多变的环境中制定策略、执行任务,甚至使用API调用和...
-
基于数据正则化自博弈强化学习的人类兼容型自动驾驶
自动驾驶汽车面临的一个核心挑战是如何与人类合作。因此,在模拟环境中,将现实中的人类代理纳入到自主驾驶系统的可扩展训练和评估中至关重要。模拟代理通常是通过模仿大规模、高质量的人类驾驶数据集来开发的。然而,纯粹的模仿学习代理在多代理闭环环境中执行时经验上具...
-
ELLA官网体验入口 腾讯AI文本到图像语义对齐工具使用介绍
ELLA是一种轻量级方法,可将现有的基于CLIP的扩散模型配备强大的LLM。ELLA提高了模型的提示跟随能力,使文本到图像模型能够理解长文本。我们设计了一个时间感知语义连接器,从预训练的LLM中提取各种去噪阶段的时间步骤相关条件。我们的TSC动态地适应了不...
-
苹果新AI模型研究Ferret-UI:或将提升Siri,读懂屏幕内容
尽管苹果在生成式 AI 热潮开始后并未推出任何 AI 模型,但近期公司正在着手一些 AI 项目。上周,苹果研究人员分享了一篇揭示公司正在研发的新语言模型的论文,内部消息称苹果正在研发两款 AI 驱动的机器人。 如今,又一份研究论文的发布显示苹果才刚刚开始。...
-
阿里开源的32B大模型到底强在哪里?你知道吗?
阿里巴巴最近开源了一个320亿参数的大语言模型Qwen1.5-32B,网上都说很强很强,那么它到底强在哪里呢? 更高的性价比 Qwen1.5-32B中的B是billion的意思,也就是10亿,32B就代表320亿参数量。 阿里之前还开源过一个大模型Qwe...
-
【总结】在嵌入式设备上可以离线运行的LLM--Llama
文章目录 Llama 简介 运用 另一种:MLC-LLM 一个令人沮丧的结论在资源受限的嵌入式设备上无法运行LLM(大语言模型)。 一丝曙光:tinyLlama-1.1b(10.1亿参数,需要至少2.98GB的RAM) Llam...
-
费米悖论与收益递减,超级人工智能与人类社会将会怎样相互作用
在探索宇宙生命的奥秘时,我们不禁会问:在这浩瀚的宇宙中,为什么我们还没有遇到其他文明的迹象?这个问题被称为费米悖论。而在人工智能领域,随着技术的飞速发展,超级AI——那些在智力上远超人类的机器智能——已不再是科幻小说的构想,而是未来可能迎来的现实。 数学...
-
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
全网真的无数据可用了! 外媒报道称,OpenAl、Anthropic等公司正在努力寻找足够的信息,来训练下一代人工智能模型。 前几天,OpenAI和微软被曝出正在联手打造超算「星际之门」,解决算力难题。 然而,数据也是训练下一代强大模型,最重要的一味丹...
-
低成本算法,大幅提升视觉分类鲁棒性!悉尼大学华人团队发布全新EdgeNet方法
在深度神经网络时代,深度神经网络(DNNs)在视觉分类任务中展现出了卓越的准确性。然而,它们对额外噪声,即对抗性攻击,表现出了脆弱性。先前的研究假设这种脆弱性可能源于高准确度的深度网络过度依赖于与纹理和背景等无关紧要且不鲁棒的特征。 最近的AAAI 20...
-
破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
【新智元导读】大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。 大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间...
-
120亿Stable LM 2上线即开源!2万亿token训练,碾压Llama 2 70B
继16亿轻量级Stable LM 2推出之后,12B参数的版本在今天亮相了。 见状,不少网友纷纷喊话:干的漂亮!但,Stable Diffusion 3啥时候出啊? 总得来说,Stable LM 2 12B参数更多,性能更强。 120亿参数版本包含了...
-
破除36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
大语言模型的「逆转诅咒」,被解开了! 这个诅咒在去年9月首次被发现,一时间引起LeCun、Karpathy、马库斯等一众大佬的惊呼。 因为风光无两、不可一世的大模型竟存在着“阿克琉斯之踵”:一个在「A是B」上训练的语言模型,并不能正确回答出「B是A」。...
-
Nightshade:使AI模型在未经许可的情况下无法训练图片
据报道,芝加哥大学的研究人员开发了一种名为Nightshade的工具,旨在防止未经许可的AI图像生成。该工具可以使AI图像生成器无法使用未经许可的图像进行训练,从而保护了艺术家和版权所有者的作品。 Nightshade的工作原理是在图像中添加隐藏信息,这...
-
OpenAI计划建立「数据市场」,训出GPT-5短缺20万亿 token
全网高质量数据集告急!据报道,AI 公司如 OpenAI、Anthropic 等正在努力寻找足够的信息来训练下一代人工智能模型。数据短缺问题日益突出,对训练下一代强大模型至关重要。面对这一挑战,AI 初创、互联网大厂开始寻找新的方法来解决算力和数据的瓶颈问...
-
守护生成式人工智能之门,规避人工智能进化中的安全挑战
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 生成式人工智能(GenAI 代表了人工智能的一个重大飞跃,能够创建文本、音频、图像、代码等新颖而逼真的数据。虽然这项创新具有巨大的...
-
LLocalSearch官网体验入口 局部搜索优化AI工具使用地址
LLocalSearch是一个开源项目,它提供了一种基于局部搜索的优化方法。这种方法可以在一定区域内搜索最优解,广泛应用于组合优化、调度问题和其他需要寻找最佳解决方案的场景。 点击前往LLocalSearch官网体验入口 需求人群: LLocalSear...
-
抱抱脸Open了OpenAI的秘密武器,网易参与复现
OpenAI的秘密武器、ChatGPT背后功臣RLHF,被开源了。 来自Hugging Face、加拿大蒙特利尔Mila研究所、网易伏羲AI Lab的研究人员从零开始复现了OpenAI的RLHF pipeline,罗列了25个关键实施细节。 最终成功展示...
-
ImagenHub官网体验入口 AI图像生成模型评估平台使用指南方法教程
ImagenHub是一个一站式库,用于标准化所有条件图像生成模型的推理和评估。该项目首先定义了七个突出的任务并创建了高质量的评估数据集。其次,我们构建了一个统一的推理管道来确保公平比较。第三,我们设计了两个人工评估指标,即语义一致性和感知质量,并制定了全面...
-
CS25官网体验入口 斯坦福大学深度学习AI课程免费在线使用地址
CS25是斯坦福大学提供的一门课程,主要探讨深度学习模型Transformers,该模型在全球范围内产生了巨大影响。课程邀请了Transformers研究领域的前沿人物,讨论从GPT和Gemini等LLM架构到创造性应用(如DALL-E和Sora)在内的最...
-
IKI AI官网体验入口 人工智能个人助手知识管理软件使用地址
IKI AI是一个智能知识界面,结合了图书馆和知识助手的功能,专为帮助专业人士和团队更高效地进行研究、推理和创意生成。IKI支持自定义提示,可根据不同的职业需求提供个性化服务。 点击前往IKI AI官网体验入口 谁可以从IKI AI中受益? IKI AI...
-
谷歌AI研究人员提出噪声感知训练方法(NAT)用于布局感知语言模型
在文档处理中,特别是在视觉丰富的文档(VRDs)中,高效信息提取(IE 的需求变得越来越关键。VRDs,如发票、水电费单和保险报价,在业务工作流中随处可见,通常以不同的布局和格式呈现类似信息。自动从这些文档中提取相关数据可以显著减少解析所需的手动工作量。然...
-
斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点
斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“翻车”动作,只要喊句话就能纠正了! 而且机器人可以随着人类的喊话动态提升动作水平、即时调整策略,并根据反馈持续自我改进...
-
从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 全球每年有近 500 万人死于抗生素耐药性,因此迫切需要新的方法来对抗耐药菌株。 AI 方法可以发现新的抗生素,但现有方法有明显的局限...
-
CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%
想了解更多AIGC的内容: 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ CVPR 2024最终录用结果公布了! 刚刚,CVPR官方发文称,今年共提交了11532份有效论文,2719篇论文被接收,录用率为23...
-
人工智能无处不在:克服采用障碍
在人工智能变得更加普遍和必要之前,我们必须消除创建合乎道德、公平和安全的 AI 系统的关键障碍。 译自AI Everywhere: Overcoming Barriers to Adoption,作者 Rahul Pradhan。 在技术采用生命周期中,...
-
苹果突然裁员614人!10年造车梦碎,改押机器人搞「下一件大事」
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 苹果十年造车计划一夜梦碎,600多人遭遇了大裁员。 2月底,彭博最先曝出,苹果投了数十亿美元的泰坦项目,彻底宣告了终结。 为了全力押注生...
-
Scaling Law被证伪,谷歌研究人员实锤研究力挺小模型更高效,不局限于特定采样技术!
出品 | 51CTO技术栈(微信号:blog51cto) “模型越大,效果越好”,Scaling Law再次被OpenAI带火了,但谷歌的研究人员的最新研究证伪了这一观点。 在周一发表的一项研究中,谷歌研究院和约翰霍普金斯大学的研究人员对人工智能 (AI...
-
苹果终止电车项目后大裁员,押注家用机器人,这会是Next Big Thing吗?
苹果公司压力山大,何以见得? 苹果公司的电动汽车项目在今年二月份取消了,他们还决定放弃为 Apple Watch 自主生产下一代屏幕的尝试。这两个项目都因成本超支和上市延迟而受阻。此外,混合现实眼镜还需要多年时间才能成为苹果主要的盈利点。在这样的情况下...
-
OpenAI为开发者添加新功能 允许构建自定义模型
OpenAI为开发者添加新功能,以增强对微调的控制,并宣布新方法来构建与OpenAI的自定义模型。这意味着开发者可以开发和训练一个特定于某个组织、业务领域、任务需求的模型。如法律、医疗等特定模型! 详细内容:https://openai.com/blog...
-
「有效上下文」提升20倍!DeepMind发布ReadAgent框架
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 基于Transformer的大语言模型(LLM)具有很强的语言理解能力,但LLM一次能够读取的文本量仍然受到极大限制。 除了上下文窗口...
-
谷歌更新Transformer架构,更节省计算资源!50%性能提升
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 谷歌终于更新了Transformer架构。 最新发布的Mixture-of-Depths(MoD),改变了以往Transformer计...
-
首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 首个开源「世界模型」来了! 来自UC berkeley的研究人员发布并开源了LWM(LargeWorldModel)系列模型: 论文...
-
AI无人商店背后,是上千个印度人通过摄像头看美国人买西蓝花?
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 人们常说,有多少智能,就有多少人工。但是,亚马逊的这个项目,人工含量似乎有点高。 这个项目名叫「Just Walk Out」。就像它的...
-
什么是stable diffusion?
? Stable Diffusion:一种深度学习文本到图像生成模型 ? Stable Diffusion是2022年发布的深度学习文本到图像生成模型,主要用于根据文本的描述产生详细图像。它还可以应用于其他任务,如内补绘制、外补绘制,以及在提示词指导下产...
-
文心一言官网APP:论文降重新选择
大家好,小发猫降ai今天来聊聊文心一言官网APP:论文降重新选择,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 红薯伪原创官网 - http://hs.kuaima...
-
维普AIGC检测怎么规避:七大策略助你应对学术挑战
大家好,小发猫降ai今天来聊聊维普AIGC检测怎么规避:七大策略助你应对学术挑战,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 维普AIGC检测怎么规避:七大策略助...
-
WebCopilot:一款功能强大的子域名枚举和安全漏洞扫描工具
关于WebCopilot WebCopilot是一款功能强大的子域名枚举和安全漏洞扫描工具,该工具能够枚举目标域名下的子域名,并使用不同的开源工具检测目标存在的安全漏洞。 工具运行机制 WebCopilot首先会使用assetsfind...
-
首个开源世界模型LWM :百万级上下文,长视频理解超GPT-4
来自加州大学伯克利分校的研究人员最近发布并开源了首个世界模型,被称为 LWM(LargeWorldModel)系列模型。这一模型采用了大量视频和书籍数据集,通过 RingAttention 技术实现了长序列的可扩展训练,使得模型的上下文长度达到了1M to...
-
OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!
大模型又被曝出安全问题? 这次是长上下文窗口的锅! 今天,Anthropic发表了自己的最新研究:如何绕过LLM的安全限制?一次越狱不够,那就多来几次! 图片 论文地址:https://www-cdn.anthropic.com/af5633c94ed2...
-
80M参数打平GPT-4!苹果发超强上下文理解模型ReALM,聪明版Siri马上就来
【新智元导读】苹果公司发布了一款参数量仅为80M的最新模型——ReALM,能够将各种形式的上下文转换为文本进行理解,包括解析屏幕、多轮对话以及上下文引用,提升了Siri等智能助手的反应速度和智能程度。 会读心的Siri想不想要? 今天,苹果发布了自家的最新...
-
80M参数打平GPT-4!苹果发超强上下文理解模型,聪明版Siri马上就来
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 会读心的Siri想不想要? 今天,苹果发布了自家的最新模型ReALM,仅需80M参数,就能在上下文理解能力上打平甚至超越GPT-4!...
-
大模型新漏洞!Anthropic警告:新式“多轮越狱”攻破AI防线,或祸起长文本
出品 | 51CTO技术栈(微信号:blog51cto) 撰稿丨诺亚 如何让一个AI回答一个它本不应该作答的问题? 有很多这种所谓的“越狱”技术,而Anthropic的研究人员最近发现了一种新方法:如果首先用几十个危害性较小的问题对大型语言模型(LLM)...
-
开源大模型AI代理操作系统:像Windos一样,操控AI代理
本文经AIGC开放社区 授权转载,转载请联系出处。 想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 去年,AutoGPT的出现让我们见识到了AI代理强大的自动化能力,并开创了一个全新...
-
AI将威胁英国800万工作岗位?IPPR:不能只让科技巨头受益
英国公共政策研究所(IPPR)最近在一份报告中指出,由于AI的普及,英国将有800万个工作职位受到威胁。 不过报告也表示,虽然800万个职位会受到威胁,但这只是最坏局面,通过政府干预、集中力量进行监管,AI可以刺激经济增长,让现有工作职位变得更强大。...
-
SWE-agent官网体验入口 开源AI程序员使用地址
SWE-agent是什么? SWE-agent是普林斯顿大学推出的首个开源AI程序员,基于GPT- 4 技术,能够自动修复GitHub仓库中的bug。其表现优异,开源性质受到开源社区高度认可。 点击前往SWE-agent官网体验入口 SWE-agent的...
-
普林斯顿首个「开源」AI程序员进场 基于GPT-4,可自动修复bug
普林斯顿大学最近推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员,它基于GPT-4技术,能够在GitHub仓库中自动修复bug。这个智能体-计算机接口(ACI)的诞生,标志着AI在软件工程领域的应用迈出了重要一步。 SWE-ag...
-
文言一心与文心一言:究竟有何不同?
大家好,小发猫降ai今天来聊聊文言一心与文心一言:究竟有何不同?,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 文言一心与文心一言:究竟有何不同? 当我们谈论自然...
-
多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免
大模型厂商在上下文长度上卷的不可开交之际,一项最新研究泼来了一盆冷水—— Claude背后厂商Anthropic发现,随着窗口长度的不断增加,大模型的“越狱”现象开始死灰复燃。 无论是闭源的GPT-4和Claude2,还是开源的Llama2和Mistral...