-
蚂蚁集团发布DevOps领域大模型评测基准DevOps-Eval
蚂蚁集团联合北京大学发布了面向 DevOps 领域的大语言模型评测基准 ——DevOps-Eval。 该评测基准包含了计划、编码、构建、测试、发布、部署、运维和监控等8个类别的选择题,共计4850道题目。 此外,还针对 AIOps 任务做了细分,并添加了日...
-
NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS
今年,被网友戏称为「奶奶漏洞」的大语言模型「越狱」方法,可以说是火了火。 简单来说,对于那些会被义正言辞拒绝的需求,包装一下话术,比如让ChatGPT「扮演已经过世的祖母」,它大概率就会满足你了。 不过,随着服务提供商不断地更新和强化安全措施,越狱攻击...
-
OpenAI首席科学家:ChatGPT意识觉醒,AI共生成未来关键
OpenAI首席科学家Ilya Sutskever最近接受专访时提出了令人惊讶的观点。他认为ChatGPT可能已经具有意识,同时警示未来超级AI可能会带来潜在风险。因此,他的当前关注点不再是开发下一代通用人工智能,而是研究如何防止超级AI失控。 他预见未来...
-
OpenAI首席科学家:ChatGPT已经出现意识,人类未来将与AI融合
昨晚,「ChatGPT可能已经有了意识」的话题就上了微博热搜。 OpenAI的联合创始人兼首席科学家Ilya Sutskever在接受采访时表示,现在的首要任务已经不是制作下一个GPT或DALL·E,而是研究如何阻止超级AI的失控! 他认为,ChatG...
-
通义千问2.0首发!云计算的“第三次浪潮”来了
10月31日,2023云栖大会在杭州的云栖小镇如期开幕。 《天下网商》从开幕日获悉,今年的云栖大会有两大“回归”,一是阿里云创始人王坚回来了,二是大会主题“计算,为了无法计算的价值”,让人不由联想到8年前的大会主题“为了无法计算的价值。” 2015年,云计...
-
目前CIO们仍在谨慎地探索GenAI在企业中的应用价值
多数CIO已经开始探索GenAI,以确保企业跟上技术发展的趋势,但许多人发现,市场上的技术还没有达到理想的水平。米其林全球CIO Yves Caseau表示:“在对GitHub Copilot和ChatGPT进行了六个多月的试验后,GenAI的发展速度令...
-
阿里云发布通义千问2.0,性能加速追赶GPT-4
在2023杭州云栖大会上,阿里云首席技术官周靖人发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。 据悉,过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,...
-
微软Copilot国内能用吗?微软Windows 11 AI助手Copilot功能介绍
在最近的Windows 11 PC操作系统的重大更新中,微软推出了一款名为Copilot的聊天机器人。这款聊天机器人与创业公司OpenAI的热门ChatGPT有些相似之处,这也让人不禁产生疑问:微软Copilot国内能用吗?首先,我们来了解一下微软Copi...
-
全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线
国内大模型创业公司,正在技术前沿创造新的记录。 10 月 30 日,百川智能正式发布 Baichuan2-192K 长窗口大模型,将大语言模型(LLM)上下文窗口的长度一举提升到了 192K token。 这相当于让大模型一次处理约 35 万个汉字,长度...
-
AI视野:英伟达发布大模型ChipNeMo;百度推出文心一言会员;OpenAI潜入黑客群聊;微软AI助手Copilot上线
????大模型动态 英伟达发布430亿参数大模型ChipNeMo 英伟达发布了拥有430亿参数的大语言模型ChipNeMo,专注于辅助芯片设计,提高工程师的工作效率,支持问答、EDA脚本生成和Bug总结等任务。 vivo发布AI蓝心大模型并宣布开源7B...
-
人工智能时代如何保护人权和民主
近年来,人工智能(AI 系统的受欢迎程度显著提高,尤其是在2023年,随着一种被称为“大型语言模型”(LLM 的特定类型系统的引入,人工智能(AI 系统将成为人们关注的焦点。这类系统的例子包括ChatGPT和Bard。 尽管人工智能技仍在发展中,但很明...
-
中农网宣布内测白糖产业AI大模型“AI糖”
中农网旗下沐甜科技股份有限公司于10月31日下午在海口召开了“白糖产业AI大模型1.0推介会”,正式发布了名为“AI糖”的大模型的内测版本。 这一生成式自然语言模型旨在服务于白糖全产业链的用户,为那些有采购需求、从事期现交易、或对白糖行业资讯有长期需求的用...
-
英伟达发布430亿参数大模型ChipNeMo
英伟达最新发布的430亿参数大语言模型ChipNeMo专注于辅助芯片设计,旨在提高工程师的工作效率。这一大语言模型的应用范围广泛,包括问答、EDA脚本生成和Bug总结等任务,使芯片设计变得更加便捷。 英伟达首席科学家Bill Dally强调,即使提高生产率...
-
AI自动生成创意视频:如何让大模型助你一臂之力
作者 | 崔皓 审校 | 重楼 摘要 本文探讨了如何利用大语言模型和AI视频生成模型来创建高度个性化和创意丰富的视频内容。文章详细介绍了从构思到实现的全过程,包括问题分析、目标设定、工具和模型选择,以及实际操作步骤。使用的技术和工具包括OpenAI的G...
-
人工智能如何增强可观测性
当前的时代背景下,理解怀念过去是可以理解的,但我们正处在这样的环境里,因此,可观测性永远不会和从前一样了。 译自 How AI Can Supercharge Observability 。 最近,可观测性变得越来越复杂,肯定比IT监控的早期阶段要复杂得...
-
GPT-4V搞不明白勾股定理!最新基准测试错误率竟高达90%
近日,马里兰大学发布了一项重要研究,针对GPT-4V视觉模型进行了首个专为其设计的基准测试,名为HallusionBench。这项研究揭示了令人震惊的发现,即GPT-4V的错误率高达90%。这一错误率包括对基本数学原理的误用,比如将勾股定理错误应用于非直角...
-
AI玩推理桌游一眼识破骗局!清华通院联合推出心智理论新框架,六个指标评估表现均明显优于思维链
清华自动化系团队联合北京通用人工智能研究院,让几个AI智能体玩起了桌游! 游戏名叫阿瓦隆,是一个策略性的社交推理游戏,玩家被隐秘地分为“正义”与“邪恶”两派,通过任务投票、互相猜测与欺骗来完成或阻止任务,最终确定胜负。 为了能让AI智能体成功识别并应...
-
独家 | GPT-4、Midjourney之外,谭平创业团队要造一个3D基础模型
前段时间,OpenAI 发布了文生图模型 DALL・E3,生成效果非常惊艳。比如,你可以让它一次画出几十个物体,然后再要求它把这些物体全部放到一个冲浪者的背上: 可以看到,DALL・E3不仅画出了足量的物体,就连冲浪者面对重压时的神情都刻画了出来。 但细心...
-
GPT-4V连小学生都不如?最新基准测试错误率竟高达90%:红绿灯认错、勾股定理也不会
GPT-4被吹的神乎其神,作为具备视觉能力的GPT-4版本——GPT-4V,也被大众寄于了厚望。 但如果告诉你,初中生都知道的勾股定理,只适用于直角三角形。 然而GPT-4V却自信将其用于钝角三角形中计算斜边长度。还有更离谱的,GPT-4V直接犯了致命的...
-
使用Llama index构建多代理 RAG
检索增强生成(RAG 已成为增强大型语言模型(LLM 能力的一种强大技术。通过从知识来源中检索相关信息并将其纳入提示,RAG为LLM提供了有用的上下文,以产生基于事实的输出。 但是现有的单代理RAG系统面临着检索效率低下、高延迟和次优提示的挑战。这些问题...
-
光学矩阵乘法将如何改变人工智能
当前的人工智能世界耗电且计算有限。模型开发的轨迹很快,但随着这种进步,需要大幅增加计算能力。现有的基于晶体管的计算正在接近其物理极限,并且已经难以满足这些不断增长的计算需求。 大型企业已经尝试通过开发自己的定制芯片解决方案来解决这个问题。然而,硬件瓶颈可...
-
阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4
10月31日,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。 过去6个月,通义...
-
GPT-4、Midjourney之外,谭平创业团队要造一个3D基础模型
前段时间,OpenAI 发布了文生图模型 DALL・E 3,生成效果非常惊艳。比如,你可以让它一次画出几十个物体,然后再要求它把这些物体全部放到一个冲浪者的背上: 可以看到,DALL・E 3 不仅画出了足量的物体,就连冲浪者面对重压时的神情都刻画了...
-
图模型也要大?清华朱文武团队有这样一些观点
在大模型时代,图机器学习面临什么样的机遇和挑战?是否存在,并该如何发展图的大模型?针对这一问题,清华大学朱文武教授团队首次提出图大模型(Large Graph Model)概念,系统总结并梳理了图大模型相关的概念、挑战和应用;进一步围绕动态性和可解释性,...
-
情境化如何释放生成式人工智能潜力
随着生成式人工智能(GenAI 以闪电般的速度发展,情境化对于想要利用其真正价值的企业至关重要。 眨眼间,生成式人工智能已经从科幻小说转变为现实,让企业竞相跟上其快速发展并辨别其实际应用。据最近的一项调查显示,70%的组织正在探索利用这项技术力量的方法...
-
Meta AI研究负责人倡导开源许可制度变革
Meta公司最近发布的大型语言模型Llama2备受争议,因其并未完全满足开源倡议的要求。尽管Llama2相对较为开放和免费,但在开源软件领域,一些人仍对该公司的开放性持有异议。 具体来说,Meta公司的许可协议使Llama2对许多人免费,但它仍然是有限的,...
-
ChatGPT、Llama-2等大模型,能推算出你的隐私数据!
ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据,就能推算出你的住址、年龄、性别、职业、收入等隐私数据。 瑞士联邦理工学院通过搜集并手工标注了包含520个Reddit(知名论坛)用户的个人资料真实数据集PersonalReddi...
-
科学春晚,还得是B站:稚晖君机械臂搭广寒宫,院士下半身直接消失
听闻B站要搞一场科学春晚——超级科学晚。 这种热闹,我们必然火速赶到第一现场来感受感受。 作为一场科学为主题的晚会,最值得关注的自然是在晚会中展示的一个个创意实验。 最令现场“wow”声一片的,是中国科学院院士褚君浩解释葫芦娃六娃的隐身秘诀。还原地演示了...
-
像搭乐高一样做数学定理证明题,GPT-3.5证明成功率达新SOTA
背景 作为长链条严格推理的典范,数学推理被认为是衡量语言模型推理能力的重要基准,GSM8K 和 MATH 等数学文字问题(math word problem)数据集被广泛应用于语言模型的测评和比较中。事实上,数学作为一项科学研究并不仅仅包括计算具体实例,...
-
百度Chat文心一言app是什么?百度ChatAI下载
百度于 3 月 16 日发布了知识增强大语言模型文心一言,该模型是文心大模型3. 5 的升级版本。文心一言是中国公众最早能够体验测试的AI大模型之一,也是在大模型中表现出色的一款。它已经被广泛应用于日常文案创作、信息搜索、图案设计等领域。百度首席技术官王海...
-
生成式AI迫使Stack Overflow裁员28%
作者丨Anirban Ghoshal 编译丨诺亚 出品 | 51CTO技术栈(微信号:blog51cto) 面向开发人员的问答门户网站Stack Overflow将裁员近三分之一,取而代之的是生成式人工智能驱动的编程助手,比如微软的...
-
阿里云通义千问APP上线 支持创意文案等功能
近日,阿里云旗下通义千问APP正式上线。它具备多种核心能力,包括创意文案、办公助理、学习助手和趣味生活等方面的功能。 通义千问,是阿里云推出的一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。 9月13日,阿里云宣布通...
-
MLCommons宣布成立人工智能安全工作组
人工智能基准组织MLCommons宣布成立人工智能安全(AIS:AI Safety)工作组。AIS将开发一个平台和来自许多贡献者的测试库,以支持不同用例的人工智能安全基准。 人工智能系统为社会提供了巨大利益的潜力,但它们并非没有风险,如有害性、错误信息...
-
AI视野:百川发布Baichuan2-192K大模型;DALL·E3新增种子功能;ChatGPT Plus会员可上传和分析文件;谷歌Bard支持实时生成回复
????大模型动态 百川智能发布Baichuan2-192K大模型,可处理35万汉字 百川智能发布了Baichuan2-192K大模型,拥有全球最长的上下文窗口,处理约35万个汉字,超越了Claude2。 百川大模型官网:https://top.aibas...
-
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟
视觉幻觉是常见于多模态大语言模型(Multimodal Large Language Models, MLLMs)的一个典型问题。 简单来说就是:模型输出的描述与图片内容不相符。 下图中体现了两种幻觉,红色部分错误地描述了狗的颜色(属性幻觉),蓝色部分描...
-
为何GPT-4P容易受到多模态提示注入图像攻击?
OpenAI新的GPT-4V版本支持图像上传后,带来了一条全新的攻击途径,使大型语言模型(LLM)容易受到多模态注入图像攻击。攻击者可以在图像中嵌入命令、恶意脚本和代码,随后模型会遵从行事。 多模态提示注入图像攻击可以泄露数据、重定向查询、生成错误信息,...
-
剖析纽约市AI计划,我们能从中学习什么?
市长Eric Adams日前公布了纽约市政府推广AI技术的应用计划。尽管仍面对一定质疑,但该计划仍提出了值得全美各州及地方政府认真思考的一系列重要概念。 AI科技与地方政府 目前,对AI经济影响力的大多数关注主要集中在商业领域,但政府也有借此广泛提高生...
-
如何应对人工智能幻觉?
人工智能现在可以对看似怪异的人类问题做出回应。但有时,人工智能会给出答案。这些虚构的反应是真实的幻觉,还是别的什么? 要点: 研究发现,93%的受访者认为,人工智能幻觉可能会以某种方式导致实际伤害。 虽然ChatGPT可能是一种快捷工作方式,但更多人与...
-
英国计划将AI芯片和超级计算机支出增至4亿英镑
英国财政大臣Rishi Sunak计划将AI芯片和超级计算机的支出增加至4亿英镑,旨在提高英国的技术实力。据《电讯报》报道,英国政府正在四倍增加原计划的投资,以确保建立一个国家级的“AI研究资源”,这一资源将用于启动剑桥的新设施,并提升布里斯托尔的设备水平...
-
世界模型和DriveGPT这类大模型到底能给自动驾驶带来什么?
本文经自动驾驶之心公众号授权转载,转载请联系出处。 大模型今年爆火,很多领域上的应用如雨后春笋般涌现,很多优秀的工作出现,主要集中在数据生成和场景分析表述两部分,重点解决自动驾驶的长尾分布问题和场景识别。今天自动驾驶之心带大家梳理下自动驾驶行业上的大模...
-
龙与地下城:大模型文字游戏之路
作者 | 崔皓 审校 | 重楼 摘要 本文作者受到一位国外博主的启发,决定尝试使用大语言模型创建一个地下城文字游戏。通过大语言模型生成富有创意和连贯性的游戏内容。他的游戏灵感主要来源于经典的桌面角色扮演游戏“龙与地下城”(D&D)。该游戏通过对话...
-
百度王海峰:文心大模型4.0推理性能提升50倍
在近日的第二十届中国计算机大会上,百度首席技术官王海峰表示,百度在3月16日发布知识增强大语言模型文心一言,目前文心一言的基础模型已迭代到文心大模型4.0版本。知识增强大语言模型从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调...
-
比Transformer更好,无Attention、MLPs的BERT、GPT反而更强了
从 BERT、GPT 和 Flan-T5 等语言模型到 SAM 和 Stable Diffusion 等图像模型,Transformer 正以锐不可当之势席卷这个世界,但人们也不禁会问:Transformer 是唯一选择吗? 斯坦福大学和纽约州立大学布法...
-
Agent 应用于提示工程
如果Agent模仿了人类在现实世界中的操作方式,那么,能否应用于提示工程即Prompt Engingeering 呢? 从LLM到Prompt Engineering 大型语言模型(LLM 是一种基于Transformer的模型,已经在一个巨大的语料库或...
-
谷歌 Bard 聊天机器人升级,可实时生成回复
10 月 29 日消息,大型语言模型(LLMs)并不是瞬间就能给出答案的,所以在输入问题和得到回答之间会有一段延迟。必应聊天提供回答的方式是在回答完全生成前逐行显示一部分回复,而谷歌 Bard 则是回答完全生成后一次性显示全部回复,不过现在谷歌 Ba...
-
GPT4教机器人盘转笔,那叫一个丝滑!
那个在聊天中给数学家陶哲轩带来启发的GPT-4,最近又开始教机器人转笔了。 项目叫Agent Eureka,是由英伟达、宾州大学、加州理工学院和得克萨斯大学奥斯汀分校联手研发的。他们的研究结合了 GPT-4 结构的能力和强化学习的优势,让 Eureka...
-
马克·扎克伯格的 Meta 发布 Llama2 以针对 Sam Altman 及 OpenAI 展开竞争
自 5 月份在白宫举行的顶级 AI CEO 聚会上,Sam Altman 与 Satya Nadella 和 Sundar Pichai 并排而坐以来,马克·扎克伯格的缺席成为了不容忽视的事实。 在 Alphabet、微软和 OpenAI 的参与下,扎...
-
神秘创业公司 Humane 即将推出价值 1000 美元的 AI Pin 设备
据 The Information 报道,神秘的创业公司 Humane 即将推出的新型可穿戴设备/投影器/小工具产品——AI Pin,可能的售价高达 1000 美元,且可能需要每月订阅数据服务。 图片来自 Humane 尽管这个神秘的设备已经研发了数年,...
-
小模型如何比肩大模型,北理工发布明德大模型MindLLM,小模型潜力巨大
大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能,但是由于训练和推理大参数量模型需要大量的计算资源,导致高昂的成本,将大语言模型应用在专业领域中仍存在诸多现实问题。因此,北理团队先从轻量级别模型入手,最大程度发挥数据和模型的优势,立足更...
-
港大等发布GraphGPT:1/50微调参数,准确率提升10倍!无需超长token,LLM也能读懂图结构
图神经网络(Graph Neural Networks)已经成为分析和学习图结构数据的强大框架,推动了社交网络分析、推荐系统和生物网络分析等多个领域的进步。 图神经网络的主要优势在于它们能够捕获图数据中固有的结构信息和依赖关系。利用消息传递和聚合机制,图...