-
谷歌更新Transformer架构,更节省计算资源!50%性能提升
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 谷歌终于更新了Transformer架构。 最新发布的Mixture-of-Depths(MoD),改变了以往Transformer计...
-
首个开源世界模型!百万级上下文,长视频理解吊打GPT-4,UC伯克利华人一作
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 首个开源「世界模型」来了! 来自UC berkeley的研究人员发布并开源了LWM(LargeWorldModel)系列模型: 论文...
-
AI无人商店背后,是上千个印度人通过摄像头看美国人买西蓝花?
想了解更多AIGC的内容, 请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 人们常说,有多少智能,就有多少人工。但是,亚马逊的这个项目,人工含量似乎有点高。 这个项目名叫「Just Walk Out」。就像它的...
-
什么是stable diffusion?
🌟 Stable Diffusion:一种深度学习文本到图像生成模型 🌟 Stable Diffusion是2022年发布的深度学习文本到图像生成模型,主要用于根据文本的描述产生详细图像。它还可以应用于其他任务,如内补绘制、外补绘制,以及在提示词指导下产...
-
文心一言官网APP:论文降重新选择
大家好,小发猫降ai今天来聊聊文心一言官网APP:论文降重新选择,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 红薯伪原创官网 - http://hs.kuaima...
-
维普AIGC检测怎么规避:七大策略助你应对学术挑战
大家好,小发猫降ai今天来聊聊维普AIGC检测怎么规避:七大策略助你应对学术挑战,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 维普AIGC检测怎么规避:七大策略助...
-
WebCopilot:一款功能强大的子域名枚举和安全漏洞扫描工具
关于WebCopilot WebCopilot是一款功能强大的子域名枚举和安全漏洞扫描工具,该工具能够枚举目标域名下的子域名,并使用不同的开源工具检测目标存在的安全漏洞。 工具运行机制 WebCopilot首先会使用assetsfind...
-
首个开源世界模型LWM :百万级上下文,长视频理解超GPT-4
来自加州大学伯克利分校的研究人员最近发布并开源了首个世界模型,被称为 LWM(LargeWorldModel)系列模型。这一模型采用了大量视频和书籍数据集,通过 RingAttention 技术实现了长序列的可扩展训练,使得模型的上下文长度达到了1M to...
-
OpenAI竞对用256轮对话「灌醉」大模型,Claude被骗造出炸弹!
大模型又被曝出安全问题? 这次是长上下文窗口的锅! 今天,Anthropic发表了自己的最新研究:如何绕过LLM的安全限制?一次越狱不够,那就多来几次! 图片 论文地址:https://www-cdn.anthropic.com/af5633c94ed2...
-
80M参数打平GPT-4!苹果发超强上下文理解模型ReALM,聪明版Siri马上就来
【新智元导读】苹果公司发布了一款参数量仅为80M的最新模型——ReALM,能够将各种形式的上下文转换为文本进行理解,包括解析屏幕、多轮对话以及上下文引用,提升了Siri等智能助手的反应速度和智能程度。 会读心的Siri想不想要? 今天,苹果发布了自家的最新...
-
80M参数打平GPT-4!苹果发超强上下文理解模型,聪明版Siri马上就来
想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 会读心的Siri想不想要? 今天,苹果发布了自家的最新模型ReALM,仅需80M参数,就能在上下文理解能力上打平甚至超越GPT-4!...
-
大模型新漏洞!Anthropic警告:新式“多轮越狱”攻破AI防线,或祸起长文本
出品 | 51CTO技术栈(微信号:blog51cto) 撰稿丨诺亚 如何让一个AI回答一个它本不应该作答的问题? 有很多这种所谓的“越狱”技术,而Anthropic的研究人员最近发现了一种新方法:如果首先用几十个危害性较小的问题对大型语言模型(LLM)...
-
开源大模型AI代理操作系统:像Windos一样,操控AI代理
本文经AIGC开放社区 授权转载,转载请联系出处。 想了解更多AIGC的内容,请访问: 51CTO AI.x社区 https://www.51cto.com/aigc/ 去年,AutoGPT的出现让我们见识到了AI代理强大的自动化能力,并开创了一个全新...
-
AI将威胁英国800万工作岗位?IPPR:不能只让科技巨头受益
英国公共政策研究所(IPPR)最近在一份报告中指出,由于AI的普及,英国将有800万个工作职位受到威胁。 不过报告也表示,虽然800万个职位会受到威胁,但这只是最坏局面,通过政府干预、集中力量进行监管,AI可以刺激经济增长,让现有工作职位变得更强大。...
-
SWE-agent官网体验入口 开源AI程序员使用地址
SWE-agent是什么? SWE-agent是普林斯顿大学推出的首个开源AI程序员,基于GPT- 4 技术,能够自动修复GitHub仓库中的bug。其表现优异,开源性质受到开源社区高度认可。 点击前往SWE-agent官网体验入口 SWE-agent的...
-
普林斯顿首个「开源」AI程序员进场 基于GPT-4,可自动修复bug
普林斯顿大学最近推出了一款名为SWE-agent的AI程序员,这是世界上首个开源的AI程序员,它基于GPT-4技术,能够在GitHub仓库中自动修复bug。这个智能体-计算机接口(ACI)的诞生,标志着AI在软件工程领域的应用迈出了重要一步。 SWE-ag...
-
文言一心与文心一言:究竟有何不同?
大家好,小发猫降ai今天来聊聊文言一心与文心一言:究竟有何不同?,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 文言一心与文心一言:究竟有何不同? 当我们谈论自然...
-
多忽悠几次AI全招了!Anthropic警告:长上下文成越狱突破口,GPT羊驼Claude无一幸免
大模型厂商在上下文长度上卷的不可开交之际,一项最新研究泼来了一盆冷水—— Claude背后厂商Anthropic发现,随着窗口长度的不断增加,大模型的“越狱”现象开始死灰复燃。 无论是闭源的GPT-4和Claude2,还是开源的Llama2和Mistral...
-
论文怎么躲避AIGC检测:策略与技巧
大家好,小发猫降ai今天来聊聊论文怎么躲避AIGC检测:策略与技巧,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 论文怎么躲避AIGC检测:策略与技巧 在学术领域...
-
研究发现:GPT-4在临床推理中表现优于医生,但也更经常出错
在一项新研究中,美国贝斯以色列医疗中心(BIDMC)的科学家们将一种大型语言模型与人类医生进行了临床推理能力的比较。研究人员使用了修订后的 IDEA(r-IDEA 评分,这是一种常用工具,用于评估临床推理能力。 这项研究包括给予一个由 GPT-4提供支持的...
-
ChatGPT也在评审你的顶会投稿,斯坦福新研究捅了马蜂窝,“这下闭环了”
尴了个大尬! 人们还在嘲讽有人用ChatGPT写论文忘了删掉“狐狸尾巴”,另一边审稿人也被曝出用ChatGPT写同行评论了。 而且,还是来自ICLR、NeurIPS等顶会的那种。 来自斯坦福的学者对一些顶级AI会议(如ICLR、NeurIPS、CoRL...
-
苹果开发出新款AI:可“看懂”屏幕内容并语音回复
快科技4月2日消息,据媒体报道,苹果公司近日宣布,成功研发出一款前沿的人工智能系统ReALM(Reference Resolution As Language Modeling,即基于语言建模的参考解析)。 据悉,该系统具备卓越能力,能够精准解析屏幕上模糊...
-
Circle to Search官网体验入口 AI搜索增强工具Chrome插件免费下载地址
Circle to Search是一款旨在简化和提升在线搜索过程的Chrome浏览器扩展。它利用AI技术将用户的查询转化为对话,从而解锁Chrome浏览体验的全部潜力。 点击前往Circle to Search官网体验入口 谁可以从Circle to S...
-
扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径
「扩散模型」也能攻克算法难题? 图片 一位博士研究人员做了一个有趣的实验,用「离散扩散」寻找用图像表示的迷宫中的最短路径。 图片 作者介绍,每个迷宫都是通过反复添加水平和垂直墙生成的。 其中,起始点和目标点随机选取。 从起点到目标点的最短路径中,随机采样...
-
Elmo官网体验入口 AI网络副驾驶Chrome插件免费下载地址
Elmo是一款AI网络副驾驶工具,可作为Chrome扩展程序使用。它能立即将网页内容压缩成简洁的摘要,提供特定问题的答案,从网页中搜集相关信息,并与PDF和YouTube视频互动,以提高用户的生产力和理解能力。 点击前往Elmo官网体验入口 谁可以从El...
-
3D视觉绕不开的点云配准!一文搞懂所有主流方案与挑战
本文经自动驾驶之心公众号授权转载,转载请联系出处。 作为点集合的点云有望在3D重建、工业检测和机器人操作中,在获取和生成物体的三维(3D)表面信息方面带来一场改变。最具挑战性但必不可少的过程是点云配准,即获得一个空间变换,该变换将在两个不同坐标中获取的...
-
“大海捞针”out!“数星星”成测长文本能力更精准方法,来自鹅厂
大模型长文本能力测试,又有新方法了! 腾讯MLPD实验室,用全新开源的“数星星”方法替代了传统的“大海捞针”测试。 相比之下,新方法更注重对模型处理长依赖关系能力的考察,对模型的评估更加全面精准。 利用这种方法,研究人员对GPT-4和国内知名的Kimi...
-
AI写作查出来高风险怎么办:七步化解困惑,重获学术自由
大家好,小发猫降ai今天来聊聊AI写作查出来高风险怎么办:七步化解困惑,重获学术自由,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: AI写作查出来高风险怎么办:七步...
-
马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型
本周一,马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok,这也兑现了他上周的开源承诺。截至目前,Grok 已经在 GitHub 上获得了 4.3k 颗 Star。 开源地址:https://github.com/xai-org/grok-1...
-
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升
CLIP长文本能力被解锁,图像检索任务表现显著提升! 一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。 △棕色文本为区分两张图的关键细节 Long-CLIP在保持CLIP原始特征空间的基础上,在图像生成等下游任务中即插...
-
GPT-4单项仅得7.1分,揭露大模型代码能力三大短板,最新基准测试来了
首个AI软件工程师Devin正式亮相,立即引爆了整个技术界。 Devin不仅能够轻松解决编码任务,更可以自主完成软件开发的整个周期——从项目规划到部署,涵盖但不限于构建网站、自主寻找并修复 BUG、训练以及微调AI模型等。 这种 “强到逆天” 的软件开发...
-
Mini-Gemini:简单有效的AI框架,增强多模态视觉语言模型
近期,中国香港中文大学和 SmartMore 的研究人员推出了一种名为 Mini-Gemini 的新颖框架,通过增强多模态输入处理来推动 VLMs 的发展。Mini-Gemini 采用了双编码器系统和一种新颖的补丁信息挖掘技术,结合一个特别策划的高质量数据...
-
全面综述!大模型到底微调个啥?或者说技术含量到底有多大?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 写在前面&笔者的个人理解 大型模型代表了多个应用领域的突破性进展,能够在各种任务中取得显著成就。然而,它们前所未有的规模带来了巨大的计算成本。这些模型通常由数十亿个参数组成,需要大量的计算资源才...
-
马斯克称人工智能毁灭人类的可能性为 20%,但仍值得冒险
IT之家 4 月 1 日消息,埃隆・马斯克 (Elon Musk 在早些时候举办的 Abundance 峰会 “人工智能辩论” 研讨会上表示,即使人工智能技术有 1/5 的可能性会对人类构成威胁,但其利大于弊,我们仍然值得冒险进行研发。 马斯克重新评...
-
机器人与生物医学工程:人造组织
近年来,机器人技术与生物医学工程的交叉带来了再生医学领域的突破性创新。最令人兴奋的发展之一是人造组织的创造,它为彻底改变医学治疗和疗法带来了巨大的希望。本文探讨了机器人技术和生物医学工程领域开发人造组织的开创性努力,及其在医疗保健中的潜在应用。 人造组...
-
恐怖谷!哥大华人开发「人脸机器人」,照镜子自主模仿人类表情超逼真
此前,人形机器人Ameca「大梦初醒」的神情,已让许多人感受到了真正的「恐惧」。 随着ChatGPT横空出世,得到加持的人形机器人虽擅长语言交流,但是在非语言交流,特别是面部表情,还差得很远。 未来,如果人类真的要生活在一个充满机器人的世界之中,机器...
-
比人类便宜20倍!谷歌DeepMind推出「超人」AI系统
AI的同行评审来了! 一直以来,大语言模型胡说八道(幻觉)的问题最让人头疼,而近日,来自谷歌DeepMind的一项研究引发网友热议: 大模型的幻觉问题,好像被终结了? 论文地址:https://arxiv.org/pdf/2403.18802.pdf...
-
非侵入设备贴在脖子上,就能代替人类发声,研究登《自然通讯》
在你看不到的地方,说话这件小事对于许多人来说「难于登天」:2014 年美国一项针对发声障碍的研究发现,近 1800 万成年人在使用声道说话时存在困难,而该群体中超过一半的人经历过言语衰弱问题的时间超过 10 年。 现在,一种新型非侵入式可穿戴设备成为了这...
-
1000亿美元宇宙级豪赌!微软OpenAI打造星际之门AI超算,电力能耗惊人
就在刚刚,又有大消息曝出。 据外媒The Information报道,微软和OpenAI正计划建设一个名为「星际之门」(Stargate)的特殊数据中心,为后者提供强大的计算支持。 具体来说: 微软高层计划最快在2028年启动该项目 这台超算对电力的需...
-
维普AIGC检测怎么规避:七大策略助你顺利过关
大家好,小发猫降ai今天来聊聊维普AIGC检测怎么规避:七大策略助你顺利过关,希望能给大家提供一点参考。降ai辅写 以下是针对论文AI辅写率高的情况,提供一些修改建议和技巧,可以借助此类工具: 还有: 维普AIGC检测怎么规避:七大策略助你顺...
-
大佬出走后首个发布!Stability官宣代码模型Stable Code Instruct 3B
大佬出走后,第一个模型来了! 就在今天,Stability AI官宣了新的代码模型Stable Code Instruct 3B。 图片 要说Stability也是真的很神奇,首席执行官辞职了,Stable Diffusion其中几位作者也离开了,投资公...
-
EVI人工智能对话AI使用地址入口 Hume.AI官网体验入口
Hume.AI是一项专注于开发能够理解人类情感和表情的技术的人工智能产品。它提供了表情测量API和自定义模型API,以预测和改善人类福祉。这款工具适用于需要理解和预测人类情感、行为和福祉的研究人员、开发者和企业。 点击前往Hume.AI官网体验入口 谁可...
-
Hume AI EVI对话人工智能体验入口 情感大语言模型eLLM使用地址
Hume.AI专注于开发能够理解人类情感和表情的技术,提供表情测量API和自定义模型API,以预测和改善人类福祉。近日发布的EVI是一款具有情感感知能力的对话AI,采用了情感大语言模型(eLLM)技术。 点击前往Hume.AI EVI体验入口 谁可以从H...
-
AI武器化成为地下论坛的热门话题
传统上,驱动式攻击被定义为从受损网站自动下载恶意文件而无需用户交互。然而,在报告期间审查的大多数情况中,都涉及用户操作——在近30%的事件中促进了初始访问。 威胁行为者用AI自动化攻击 在主要的网络犯罪论坛中,使用AI加速这些攻击正受到越来越多...
-
AI无法准确检测黑人社交媒体帖子中的抑郁迹象
根据一项研究发现,虽然使用人工智能分析社交媒体可能会在白人美国人身上捕捉到抑郁的迹象,但在黑人中却无法实现这一目标。研究突显了在医疗相关任务中训练人工智能模型时缺乏多样化种族和族裔群体数据的风险。研究人员报告称,该研究使用的人工智能模型在应用于使用Meta...
-
开源AI平台Lightning AI发布AI编译器“Thunder”以加速模型训练
开源人工智能平台Lightning AI宣布与Nvidia合作,发布了名为“Thunder”的下一代AI编译器,旨在加速人工智能模型的训练速度。据Lightning AI称,该编译器在实际场景中相比未优化的代码,可将大型语言模型(LLMs)的训练速度提高高...
-
大型语言模型如何教会自己遵循人类指令?
译者 | 李睿 审校 | 重楼 如今,人们对能够使大型语言模型(LLM 在很少或没有人为干预的情况下改进功能的技术越来越感兴趣。大型语言模型(LLM 自我改进的领域之一是指令微调(IFT ,也就是让大型语言模型教会自己遵循人类指令。 指令微调(IFT ...
-
深度解析韩国AI产业:猛攻AI存储芯片,傍上大款英伟达
当美国兴致勃勃向AI发起全面总攻时,“小跟班”韩国的步伐值得留意。 2023年,韩国政府对AI研发的资助约为952亿韩元(约52亿人民币)。今年预算削减28.4%,降至684亿韩元(约37亿人民币)。有人担心预算削减会导致韩国与美国差距进一步拉大,但韩...
-
苹果研发多模态AI,这是研究人员迄今发现的结果
译者 | 布加迪 审校 | 重楼 如果我告诉你,在最近热议的多模态AI背后,苹果正在悄然酝酿一场革命,你会作何感想?苹果的一群研究人员一直在系统地研究如何构建功能最强大的多模态模型,揭露了质疑传统智慧的重要见解。现在他们让我们有机会一窥底层的细节。 他...
-
一张图即出AI视频!谷歌全新扩散模型,让人物动起来
只需一张照片,和一段音频,就能直接生成人物说话的视频! 近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,让我们朝着虚拟数字人又迈进了一步。 论文地址:https://enriccorona.github.io/vlogger/paper.p...