-
大模型“藏毒”:“后门”触发,猝不及防!
撰稿 | 言征 出品 | 51CTO技术栈(微信号:blog51cto) 跟大模型会产生幻觉相比,更可怕的事情来了,最新的一项研究证明:在用户不知情的情况下,最初觉得很得力的大模型助手,将化身“间谍”,产生破坏性代码。 具体来讲,一组研究人员对LL...
-
用大模型帮程序员找Bug,中科院剖析102篇论文总结出这些方案
中科院对“找Bug”下手了,一口气总结了N种方案! 法宝就是大模型。 大模型由于其卓越的自然语言理解、推理等能力,已经被应用于各种场景,取得了前所未有的效果。 类似的,软件测试领域也受益于其强大的能力,能够帮助生成逼真且多样化测试输入,模拟各种异常,加...
-
OpenAI像素级抄袭好莱坞IP,反手开撕《纽约时报》,LeCun舌战网友疑似站队支持
去年底AI行业最爆炸性的事件要算是纽约时报和OpenAI的官司了。 在《纽约时报》一纸诉状将OpenAI告到法院,要求OpenAI要么关闭ChatGPT,要么赔偿几十亿美元。 这个新闻在国内外媒体上发酵了2周之后,OpenAI官方终于下场回怼了。 Op...
-
200亿「书生·浦语2.0」正式开源!数推性能比肩ChatGPT,200K超长上下文完美召回
就在今天,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学,正式发布新一代大语言模型书⽣·浦语2.0(InternLM2)。 Github:https://github.com/InternLM/InternLM HuggingFace:https...
-
终于,NLP顶会ACL投稿不用匿名了
对于自然语言处理领域的研究人员,最近有一条好消息。 近日,计算语言学协会年会(ACL)正式宣布,该系列会议论文投稿已取消匿名期,同时允许作者在投稿期间宣传自身工作。新规定直接适用于下一个审稿周期。 今年的 ACL 是第 62 届,将于 2024 年 8...
-
OpenAI组建新团队:收集公众意见以确保AI大模型"与人类价值观保持一致"
1月17日消息,美国当地时间周二,人工智能领域的佼佼者OpenAI在其博客上宣布,他们正在组建一个名为“集体对齐”(Collective Alignment)的全新团队。 这个团队主要由研究人员和工程师构成,将专注于设计和实施收集公众意见的流程,以帮助...
-
AI并没有学习!Nature子刊最新研究解码人工智能黑盒
人工智能(AI)一直在迅速发展,但对人类来说,强大的模型却是个「黑匣子」。 我们不了解模型内部的运作原理,不清楚它得出结论的过程。 然而最近,波恩大学(University of Bonn)的化学信息学专家Jürgen Bajorath教授和他的团队取得...
-
AI视野:智谱AI发布大模型GLM-4;腾讯发布PhotoMaker;GPT Store现多款违规AI女友;Deepfake音视频检测技术亮相CES
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。 新鲜AI产品点击了解:https://top.aibase.com/ ????大模型动态 智谱AI发布大...
-
OpenAI开源全新解码器和语音识别模型Whisper-v3
在11月7日OpenAI的首届开发者大会上,除了推出一系列重磅产品之外,还开源了两款产品,全新解码器Consistency Decoder(一致性解码器)和最新语音识别模型Whisper v3。 据悉,Consistency Decoder可以替代Sta...
-
鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞
大厂们在整活方面开始卷起来了! 前脚字节阿里的工具火了,现在腾讯这个新照片生成应用PhotoMaker直接刷屏,瞧这阵仗…… 只需上传一张或以上照片,无需额外LoRA训练,就能快速可定制。任何人、任何风格,高保真那种。 于是秒秒钟,LeCun化身钢铁侠...
-
阿布扎比大学研究揭示:AI可逼真模仿人的手写风格
近日,阿布扎比的莫哈默德·本·扎耶德人工智能大学(MBZUAI)的研究人员表示,他们已成功开发出一项技术,仅凭几段文字即可模仿某人的手写风格。这项研究表明,人工智能不仅可以生成逼真的语音克隆和深度伪造视频,还能模仿个体的书写方式。 图源备注:图片由AI生...
-
知网 AI 智能写作推出“写作选题”新功能
知网 AI 智能写作推出了新功能模块 —— 写作选题,它采用了最新的人工智能大模型技术,并以知网总库的海量学术文献资源作为底层分析数据,为研究者和写作者提供科学、智能的写作主题推荐服务。 该功能包括智能主题推荐、研究热度分析和可视化趋势与综合数据展示等核...
-
广义人工智能时代:通往通用人工智能(AGI)之路
人工智能(AI 将于2024年进一步改进,大型语言模型有望进一步发展。 2023年对于人工智能和生成式人工智能来说是激动人心的一年,特别是那些采用大型语言模型(LLM 架构的人工智能,比如来自开放人工智能(GPT 4 、Anthropic(Claud...
-
人工智能的未来:揭开技术进步的下一个前沿
人工智能(AI 正在彻底改变行业、塑造人类互动并重新定义技术创新的边界。从自动驾驶汽车到医疗诊断,人工智能的影响无处不在,几乎渗透到现代生活的方方面面。当我们站在一个新时代的悬崖上时,我们必须探索未来的未知领域,揭开人工智能未来的神秘面纱。 人工智能不...
-
超越便利:我们可以信任智能家居吗?
当我们坐在舒适的扶手椅上度过一个电影之夜时,随着投影仪启动,智能灯会自动变暗。可这时,如果收到了一条令人毛骨悚然的通知:“智能设备检测到未经授权的访问。” 我们会着急忙慌地断开所有与互联网的连接,曾经令人安慰的智能家居现在变成了一种威胁。 这不是反乌托...
-
Transformer的无限之路:位置编码视角下的长度外推综述
在自然语言处理(Natural Language Processing,NLP)领域,Transformer 模型因其在序列建模中的卓越性能而受到广泛关注。然而,Transformer 及在其基础之上的大语言模型(Large Language Model...
-
ddl是第一生产力有了科学解释,网友:给大模型试试
到年底了,大学生碰上期末周、打工人在赶KPI,没有deadline(ddl)的年底不是真年底…… ddl在我们的日常生活中普遍存在,“ddl是第一生产力”更是人们通过亲身实践得出的“至理名言”。 然鹅,关于ddl行为效应的系统证据却很少见。 不过,运...
-
大模型伪装「潜伏特工」学会欺骗!OpenAI劲敌重磅研究震惊马斯克
不要教LLM学会骗人!不要教LLM学会骗人!不要教LLM学会骗人! 因为后果可能会很严重,甚至超出人类的想象。 最近,AI初创公司Anthropic的研究表明,一旦LLM学会了人类教授的欺骗行为,它们就会在训练和评估的过程中隐藏自己,并在使用时偷偷输出恶...
-
OpenAI修改其AI模型使用政策,取消对军用应用明确禁令
OpenAI最近宣布对其AI模型使用政策进行修改,取消了以往对“军 事和战争”应用的明确禁令。这一调整被解释为将禁令内容融入更广泛的四项通用原则中,如“不要利用我们的服务伤害自己或他人”,或者“不要重新利用或分发我们服务的输出以伤害他人”。 OpenAI发...
-
可协助 AI 语言模型改善自我纠错能力,谷歌推出 BIG-Bench Mistake 数据集
IT之家 1 月 15 日消息,谷歌研究院日前使用自家 BIG-Bench 基准测试建立了一项“BIG-Bench Mistake”数据集,并利用相关数据集对市面上流行的语言模型“出错概率”及“纠错能力”进行了一系列评估研究。 谷歌研究人员表示,由于...
-
美国科技5巨头,研发狂烧2020亿刀!亚马逊732亿全球第一,Meta 30%占比最高
最近,一张2022年纳斯达克Top 10企业的研发支出图,突然火了。 可以看到,亚马逊遥遥领先,以732亿美元取得榜首。 谷歌母公司Alphabet以395亿美元紧随其后。 研发经费全球第三是Meta,全年为353亿美元。 第四是苹果,全年研发支出27...
-
能找神经网络Bug的可视化工具,Nature子刊收录
研究人员发现,在神经网络推理的某些数据图中存在尖峰,这些尖峰往往出现在神经网络判断模糊与产生错误的地方。观察这些尖峰,研究人员可以更容易发现人工智能系统中的故障点。 从分析癌症突变的原因到决定谁应该获得贷款,在解决这些问题的过程中,仿照人脑的神经网络比人...
-
大模型隐蔽后门震惊马斯克:平时人畜无害,提到关键字瞬间“破防”
“耍心机”不再是人类的专利,大模型也学会了! 经过特殊训练,它们就可以做到平时深藏不露,遇到关键词就毫无征兆地变坏。 而且,一旦训练完成,现有的安全策略都毫无办法。 ChatGPT“最强竞对”Claude的背后厂商Anthropic联合多家研究机构发表...
-
拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM
用AMD的软硬件系统也能训练GPT-3.5级别的大模型了。 位于美国橡树岭国家实验室(Oak Ridge National Laboratory)的全世界最大的超算Frontier,集合了37888个MI250X GPU和9472个Epyc 7A53 C...
-
AI看图猜位置,准确率超90%!斯坦福最新PIGEON模型:40%预测误差不到25公里
随手在网络上发布的一张照片,能暴露多少信息? 外国的一位博主@rainbolt就长年接受这种「照片游戏」的挑战,网友提供照片,他来猜测照片的具体拍摄地,有些照片甚至还能猜到具体的航班细节。 是不是细思极恐? 但「照片挑战」也同样抚慰了很多人心中的遗憾,...
-
谷歌AI通过图灵测试,大模型医生来了?GPT-4竟诊断出难倒17个医生的怪病
【新智元导读】AI在医疗领域再次发光!谷歌DeepMind团队发布的全新诊断对话式AI在测试中击败医生,通过了图灵测试,再次引领医疗AI的革命。 我们需要研发对人类有益AGI的原因之一: OpenAI联创Greg Brockman的一番话点明,当前先进A...
-
OpenAI的人工智能语音识别模型Whisper详解及使用
1 whisper介绍 拥有ChatGPT语言模型的OpenAI公司,开源了 Whisper 自动语音识别系统,OpenAI 强调 Whisper 的语音识别能力已达到人类水准。 Whisper是一个通用的语音识别模型,...
-
视觉高精地图构建的全面回顾!一起看看无图感知都有哪些落地方案(清华&滴滴)
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 近年来,自动驾驶受到越来越多的关注,高精地图成为自动驾驶技术的关键组成部分。这些地图提供了道路网络的复杂细节,并作为车辆定位、导航和决策等关键任务的基本输入。鉴于视觉...
-
效果超越Gen-2!字节最新视频生成模型,一句话让绿巨人戴上VR眼镜
一句话,就让绿巨人戴上VR眼镜。 4K画质那种。 熊猫的奇幻漂流~ 这是字节最新的AI视频生成模型MagicVideo-V2,各种奇思妙想的想法都能实现。它不仅支持4K、8K超高分辨率,轻松hold各种绘图风格。 △从左往右:油画风、赛博风、设计风...
-
一部iPhone实时渲染300平房间,精度达厘米级别!谷歌最新研究证明NeRF没死
3D实时渲染大型场景,一台电脑,甚至一部手机就可以完成。 从家里的客厅到主卧,储物间,厨房,卫生间各个死角,都能逼真在电脑中完成渲染,如同拍摄实物视频一般。 而且,你还可以在一台iPhone上完成复杂场景渲染。 来自谷歌、谷歌DeepMind和图宾根...
-
放射科医生再临危机!国外五大机构联合发布「胸部X光」最新基准
胸部X光(CXR)检查是一种广泛应用于各种疾病的筛查、诊断检查的临床成像方式。 临床诊断中,不仅包括常见的疾病类型,往往还会描述相应严重程度和不确定性,目前的医学图像数据库往往满足于预测疾病类型,而忽视了具有重大临床意义的后者。 最近,德州州立阿灵顿分校...
-
LLaMA-v2-Chat vs. Alpaca:应该在什么时候使用不同的人工智能模型?
译者 | 李睿 审校 | 重楼 如今,大型语言模型(LLM)正在彻底改变人们的工作和生活,从语言生成到图像字幕软件,再到友好的聊天机器人。这些人工智能模型为解决现实世界的问题提供了强大的工具,例如生成聊天响应或遵循复杂的指令。在这篇关于LLaMA v2的...
-
新研究:医用AI评估精神分裂新患者治疗效果近乎盲猜
1月12日消息,一项最新研究发现,用于协助医生治疗精神分裂症患者的计算机算法不能很好适应之前开发过程中未见过的新鲜数据。因此这种医用人工智能在评估未曾接触过的患者的治疗效果时,表现十分糟糕。 这些医用工具利用人工智能来发现大数据集中的特征,并预测个体对...
-
视频场景图生成任务新SOTA!中山大学提出全新时空知识嵌入框架,登顶刊TIP'24
视频场景图生成(VidSGG)旨在识别视觉场景中的对象并推断它们之间的视觉关系。 该任务不仅需要全面了解分散在整个场景中的每个对象,还需要深入研究它们在时序上的运动和交互。 最近,来自中山大学的研究人员在人工智能顶级期刊IEEE T-IP上发表了一篇论文...
-
谷歌MIT最新研究证明:高质量数据获取不难,大模型就是归途
获取高质量数据,已经成为当前大模型训练的一大瓶颈。 前几天,OpenAI被《纽约时报》起诉,并要求索赔数十亿美元。诉状中,列举了GPT-4抄袭的多项罪证。 甚至,《纽约时报》还呼吁摧毁几乎所有的GPT等大模型。 一直以来,AI界多位大佬认为「合成数据」...
-
蓝心大模型官网体验入口 vivo AI模型软件工具app免费使用地址
蓝心大模型是vivo自主研发的一款先进的智能语言理解模型,具备 70 亿模型参数量,能够处理高达32K的上下文长度。本文将详细介绍蓝心大模型的特点和应用场景。 点击前往「蓝心大模型」体验入口 蓝心大模型概览 技术特点:基于260TB的多语言训练语料,...
-
GPT-4 Turbo现在为Microsoft Copilot提供动力 —— 这里有如何检查你是否有访问权限的方法
如果你是一名开发人员、作家,或者仅仅是一名AI爱好者,到目前为止,你可能已经听说过GPT-4,这是来自OpenAI的最新和最强大的语言模型,OpenAI是ChatGPT背后的公司。GPT-4可以从单个提示生成自然语言文本或代码,在研究人员对摘要任务、写...
-
为什么人工智能如此需要资源?
截至2023年底,任何关于生成式人工智能需要多少能源的预测都是不准确的。 头条新闻倾向于猜测“人工智能需要5倍、10倍、30倍的电力”和“足够运行10万个家庭的电力”等。与此同时,数据中心新闻等专业出版物的报道称,功率密度将上升到每机架50千瓦或100千...
-
13个优秀开源语音识别引擎
语音识别(ASR)在人机交互方面发挥着重要的作用,可用于:转录、翻译、听写、语音合成、关键字定位、语音日记、语言增强等场景。语音识别基本过程一般包括:分析音频、音频分解、格式转换、文本匹配,但实际的语音识别系统可能会更复杂,并且可能包括其他步骤和功能组件...
-
单帧标注视频就能学到片段特征,达到全监督性能!华科拿下时序行为检测新SOTA
如何从一段视频中找出感兴趣的片段?时序行为检测(Temporal Action Localization,TAL)是一种常用方法。 利用视频内容进行建模之后,就可以在整段视频当中自由搜索了。 而华中科技大学与密歇根大学的联合团队最近又为这项技术带来了新的...
-
只需2分钟,单视图3D生成又快又好!北大等提出全新Repaint123方法
将一幅图像转换为3D的方法通常采用Score Distillation Sampling(SDS)的方法,尽管结果令人印象深刻,但仍然存在多个不足之处,包括多视角不一致、过度饱和、过度平滑的纹理,以及生成速度缓慢等问题。为了解决这些问题,北京大学、新加坡...
-
新AI图像分割方法GenSAM:一个提示实现批量图片分割
近期,研究人员提出了一种新型图像分割方法,称为Generalizable SAM(GenSAM)模型。该模型的设计目标是通过通用任务描述,实现对图像的有针对性分割,摆脱了对样本特定提示的依赖。在具体任务中,给定一个任务描述,例如“伪装样本分割”,模型需要根...
-
微软祭出代码大模型WaveCoder!四项代码任务两万个实例数据集,让LLM泛化能力飙升
用高质量数据集进行指令调优,能让大模型性能快速提升。 对此,微软研究团队训练了一个CodeOcean数据集,包含了2万个指令实例的数据集,以及4个通用代码相关任务。 与此同时,研究人员微调了一个代码大模型WaveCoder。 论文地址:https://...
-
回顾精彩瞬间!IEEE Spectrum盘点2023年度热门AI故事
又是冬日,又到结尾, 气温回升了一点,苍茫天地间仍有一些尚未消融的洁白。 「雪霁银装素,桔高映琼枝」。 不知大家这一年过得怎么样呢? 2023很可能成为人工智能历史上最狂野、最戏剧性的年份之一。 Spectrum总结了本年度关于AI的最受欢迎的文章,...
-
Rawbot官网体验入口 AI模型比较平台app免费使用地址
Rawbot是一个AI模型比较平台,旨在帮助用户轻松比较不同AI模型,并发挥它们在项目中的全部潜力。用户可以基于准确的并排比较来选择最佳的AI模型。Rawbot与ChatGPT、Cohere和J2 Complete等多种AI模型兼容,为用户提供广泛的选择和...
-
使用PyTorch实现去噪扩散模型
在深入研究去噪扩散概率模型(DDPM 如何工作的细节之前,让我们先看看生成式人工智能的一些发展,也就是DDPM的一些基础研究。 VAE VAE 采用了编码器、概率潜在空间和解码器。在训练过程中,编码器预测每个图像的均值和方差。然后从高斯分布中对这些值进...
-
谷歌DeepMind最新研究:对抗性攻击对人类也有效,人类和AI都会把花瓶认成猫!
【新智元导读】神经网络由于自身的特点而容易受到对抗性攻击,然而,谷歌DeepMind的最新研究表明,我们人类的判断也会受到这种对抗性扰动的影响 人类的神经网络(大脑)和人工神经网络(ANN 的关系是什么? 有位老师曾经这样比喻:就像是老鼠和米老鼠的关系。...
-
何为交互感知?全面回顾自动驾驶中的社会交互动态模型与决策前沿!
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 交互感知自动驾驶(IAAD)是一个迅速发展的研究领域,专注于开发能够与人类道路使用者安全、高效交互的自动驾驶车辆。这是一项具有挑战性的任务,因为它要求自动驾驶车辆能够理...
-
1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品
只需两分钟,玩转图片转3D! 还是高纹理质量、多视角高一致性的那种。 不管是什么物种,输入时的单视图图像还是这样婶儿的: 两分钟后,3D版大功告成: △上,Repaint123(NeRF);下,Repaint123(GS) 新方法名为Repaint...
-
检测脸部情绪有多难?10行代码就可以搞定!
面部表情展示人类内心的情感。它们帮助我们识别一个人是愤怒、悲伤、快乐还是正常。医学研究人员也使用面部情绪来检测和了解一个人的心理健康。 人工智能在识别一个人的情绪方面可以发挥很大的作用。在卷积神经网络的帮助下,我们可以根据一个人的图像或实时视频来识别他...