大语言模型第24页

GPT-4完成正确率仅6%！北大等提出首个「多轮、多模态」PPT任务完成基准PPTC

【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白，研究人员引入了PowerPoint任务完成（PPTC）基准测试，以评估LLM创建和编辑PPT文档的能力。最近对大型语言模型（例如ChatGPT和GPT-4）进行的评...

人工智能 2023-11-07 人工智能

901阅读

微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

IT之家 11 月 7 日消息，微软亚洲研究院联合北京大学、西安交通大学等高校，提出了一项名为“从错误中学习（Learning from Mistake，LeMA）”的 AI 训练方法，号称可以通过模仿人类学习知识的过程，来改进 AI 推理能力。当下...

人工智能 2023-11-07 人工智能

816阅读

OpenAI CEO：AI聊天机器人ChatGPT周活跃用户数已达1亿

11月7日消息，据外媒报道，在当地时间周一举行的OpenAI首届开发者大会上，OpenAI CEO萨姆•奥尔特曼（Sam Altman）宣布，该公司旗下AI聊天机器人ChatGPT的周活跃用户数已达到1亿。据悉，ChatGPT是OpenAI于2022年1...

人工智能 2023-11-07 人工智能

845阅读

让大模型自主探索开放世界，北大&智源提出训练框架LLaMA-Rider

大语言模型因其强大而通用的语言生成、理解能力，展现出了成为通用智能体的潜力。与此同时，在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此，大语言模型如何适配开放世界是一个重要的研究问题。北京大学和北京智源人工智能研究院的团队针对这个问题提出了...

人工智能 2023-11-07 人工智能

1228阅读

联发科发布天玑9300生成式AI移动芯片支持运行330亿参数大模型

昨日晚间，联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片，采用台积电第三代4nm 制程。该芯片预计于2023年底上市。这款芯片采用全大核架构设计，提供高智能、高性能、高能效、低功耗的特性，为用户带来卓越的生成式 AI 体验。天玑9300采...

AIGC 2023-11-07 人工智能

833阅读

OpenAI推出用户自定义版ChatGPT：可在商城自由交易

快科技11月7日消息，Open AI最近在开发者大会上表示，将会允许用户构建自定义版ChatGPT，来完成特定的个人和专业任务。 OpenAI称，用户能快速创建自己专用版本的ChatGPT，可以用于帮助教孩子数学或解释棋盘游戏的规则。 OpenAI还计划在...

人工智能 2023-11-07 人工智能

800阅读

天玑9300 AI能力飙升：最高支持330亿参数的AI大语言模型

快科技11月6日消息，联发科今晚正式发布天玑9300旗舰5G生成式AI移动芯片，支持在端侧生成式AI、游戏、影像等方面定义旗舰新体验。据介绍，天玑9300集成MediaTek第七代AI处理器APU 790，为生成式AI而设计，其性能和能效得到显著提升，整...

人工智能 2023-11-07 人工智能

797阅读

AI创企xAI发布首款人工智能聊天机器人Grok

据外媒报道，特斯拉CEO埃隆·马斯克(Elon Musk 旗下人工智能初创公司xAI发布了首款生成式人工智能聊天机器人——Grok。上周，马斯克警告称，人工智能是“对人类最大的威胁之一”。然而，这并没有阻止他参与其中。上周六，他通过一系列推文透露了G...

AIGC 2023-11-06 人工智能

891阅读

AI视野：xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理

????大模型动态李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字零一万物发布全球最强的开源大模型Yi-34B，具备超强的语言理解和处理能力，支持处理40万汉字，在中文指标上表现卓越，标志着中国在大模型领域的重大突破。项目地址:htt...

AIGC 2023-11-06 人工智能

933阅读

北大具身智能新成果：无需训练，听指令就能灵活走位

北京大学董豪团队具身导航最新成果来了：无需额外建图和训练，只需说出导航指令，如： Walk forward across the room and walk through the panty followed by the kitchen. Stan...

人工智能 2023-11-06 人工智能

913阅读

中科院物理研究所等发布材料合成AI大语言模型MatChat

近期，中国科学院计算机网络信息中心人工智能部和物理研究所SF10组合作，通过使用来自400多万篇论文中提取的35675个无机材料固相反应合成过程，将数据处理为13878条高可信度的合成路径描述数据，并对开源大语言模型LLaMA2-7B进行微调训练，研发了专...

AIGC 2023-11-06 人工智能

792阅读

20步内越狱任意大模型！更多“奶奶漏洞”全自动发现

1分钟不到、20步以内“越狱”任意大模型，绕过安全限制！而且不必知道模型内部细节—— 只需要两个黑盒模型互动，就能让AI全自动攻陷AI，说出危险内容。听说曾经红极一时的“奶奶漏洞”已经被修复了: 那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏...

AIGC 2023-11-05 人工智能

906阅读

CMU清华MIT引爆全球首个Agent无限流，机器人「007」加班自学停不下来！具身智能被革命

全球首个生成式机器人Agent发布了！长久以来，相比于语言或者视觉模型可以在大规模的互联网数据上训练，训练机器人的策略模型需要带有动态物理交互信息的数据，而这些数据的匮乏一直是具身智能发展的最大瓶颈。最近，来自CMU、清华、MIT，UMass等机构的...

AIGC 2023-11-05 人工智能

885阅读

360大模型“奇元大模型”通过备案落地

近日，360智脑官方宣布，其自主研发的“奇元大模型”已通过备案并成功落地。值得一提的是，今年9月，该模型已获批面向公众开放，使得360成为国内首家两个大模型均通过备案的科技企业。据了解，360智脑大模型具备生成创作、多轮对话、逻辑推理等十大核心能力，覆盖...

AIGC 2023-11-05 人工智能

800阅读

2024年人工智能安全发展十大预测

本周三，包括英国、美国和中国在内的近30个国家（以及欧盟）在人工智能安全峰会上达成首个全球性人工智能安全协议，并发布了《人工智能安全宣言》，这标志着人工智能正式进入安全发展的强监管时代。峰会期间，人工智能意见领袖们就人工智能安全风险的严重性判断产生重...

人工智能 2023-11-03 人工智能

893阅读

人工智能进入强监管时代

以ChatGPT为代表的基于LLM(大语言模型的生成式人工智能应用正风靡全球，各行各业都在争先恐后将其集成到前端和后端的各种系统中，与此同时生成式人工智能面临的安全风险也正随着其热度上升而凸显。生成式人工智能自身正面临提示注入等多种攻击，很可能给企...

AIGC 2023-11-03 人工智能

844阅读

科普神文，一次性讲透AI大模型的核心概念

图片令牌，向量，嵌入，注意力，这些AI大模型名词是否一直让你感觉熟悉又陌生，如果答案肯定的话，那么朋友，今天这篇科普神文不容错过。我将结合大量示例及可视化的图形手段，为你由浅入深一次性讲透AI大模型的核心概念。引言随着科技公司及国际竞争的不断推进，...

人工智能 2023-11-03 人工智能

1312阅读

大模型: 模型大了难在哪里？

大家好，我是Tim。自从GPT模型诞生以来，其参数规模就在不停的扩大。但模型并非简单的直接变大，需要在数据、调度、并行计算、算法和机器资源上做相应的改变。今天就来总结下，什么是大模型，模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...

人工智能 2023-11-03 人工智能

1634阅读

蚂蚁集团发布DevOps领域大模型评测基准DevOps-Eval

蚂蚁集团联合北京大学发布了面向 DevOps 领域的大语言模型评测基准 ——DevOps-Eval。该评测基准包含了计划、编码、构建、测试、发布、部署、运维和监控等8个类别的选择题，共计4850道题目。此外，还针对 AIOps 任务做了细分，并添加了日...

人工智能 2023-11-02 人工智能

874阅读

NTU华科等最新研究：全自动化「提示越狱」，能打败大模型的只有大模型！登安全顶会NDSS

今年，被网友戏称为「奶奶漏洞」的大语言模型「越狱」方法，可以说是火了火。简单来说，对于那些会被义正言辞拒绝的需求，包装一下话术，比如让ChatGPT「扮演已经过世的祖母」，它大概率就会满足你了。不过，随着服务提供商不断地更新和强化安全措施，越狱攻击...

AIGC 2023-11-02 人工智能

907阅读

OpenAI首席科学家：ChatGPT已经出现意识，人类未来将与AI融合

昨晚，「ChatGPT可能已经有了意识」的话题就上了微博热搜。 OpenAI的联合创始人兼首席科学家Ilya Sutskever在接受采访时表示，现在的首要任务已经不是制作下一个GPT或DALL·E，而是研究如何阻止超级AI的失控！他认为，ChatG...

AIGC 2023-11-02 人工智能

795阅读

通义千问2.0首发！云计算的“第三次浪潮”来了

10月31日，2023云栖大会在杭州的云栖小镇如期开幕。《天下网商》从开幕日获悉，今年的云栖大会有两大“回归”，一是阿里云创始人王坚回来了，二是大会主题“计算，为了无法计算的价值”，让人不由联想到8年前的大会主题“为了无法计算的价值。” 2015年，云计...

人工智能 2023-11-02 人工智能

838阅读

阿里云发布通义千问2.0，性能加速追赶GPT-4

在2023杭州云栖大会上，阿里云首席技术官周靖人发布千亿级参数大模型通义千问2.0。在10个权威测评中，通义千问2.0综合性能超过GPT-3.5，正在加速追赶GPT-4。据悉，过去6个月，通义千问2.0在性能上取得巨大飞跃，相比4月发布的1.0版本，...

人工智能 2023-11-01 人工智能

841阅读

微软Copilot国内能用吗？微软Windows 11 AI助手Copilot功能介绍

在最近的Windows 11 PC操作系统的重大更新中，微软推出了一款名为Copilot的聊天机器人。这款聊天机器人与创业公司OpenAI的热门ChatGPT有些相似之处，这也让人不禁产生疑问：微软Copilot国内能用吗？首先，我们来了解一下微软Copi...

人工智能 2023-11-01 人工智能

3494阅读

全球最强长文本大模型，一次可读35万汉字：Baichuan2-192K上线

国内大模型创业公司，正在技术前沿创造新的记录。 10 月 30 日，百川智能正式发布 Baichuan2-192K 长窗口大模型，将大语言模型（LLM）上下文窗口的长度一举提升到了 192K token。这相当于让大模型一次处理约 35 万个汉字，长度...

AIGC 2023-11-01 人工智能

949阅读

AI视野：英伟达发布大模型ChipNeMo；百度推出文心一言会员；OpenAI潜入黑客群聊；微软AI助手Copilot上线

????大模型动态英伟达发布430亿参数大模型ChipNeMo 英伟达发布了拥有430亿参数的大语言模型ChipNeMo，专注于辅助芯片设计，提高工程师的工作效率，支持问答、EDA脚本生成和Bug总结等任务。 vivo发布AI蓝心大模型并宣布开源7B...

AIGC 2023-11-01 人工智能

1040阅读

英伟达发布430亿参数大模型ChipNeMo

英伟达最新发布的430亿参数大语言模型ChipNeMo专注于辅助芯片设计，旨在提高工程师的工作效率。这一大语言模型的应用范围广泛，包括问答、EDA脚本生成和Bug总结等任务，使芯片设计变得更加便捷。英伟达首席科学家Bill Dally强调，即使提高生产率...

人工智能 2023-11-01 人工智能

877阅读

AI自动生成创意视频：如何让大模型助你一臂之力

作者 | 崔皓审校 | 重楼摘要本文探讨了如何利用大语言模型和AI视频生成模型来创建高度个性化和创意丰富的视频内容。文章详细介绍了从构思到实现的全过程，包括问题分析、目标设定、工具和模型选择，以及实际操作步骤。使用的技术和工具包括OpenAI的G...

人工智能 2023-11-01 人工智能

1627阅读

人工智能如何增强可观测性

当前的时代背景下，理解怀念过去是可以理解的，但我们正处在这样的环境里，因此，可观测性永远不会和从前一样了。译自 How AI Can Supercharge Observability 。最近，可观测性变得越来越复杂，肯定比IT监控的早期阶段要复杂得...

AIGC 2023-11-01 人工智能

847阅读

AI玩推理桌游一眼识破骗局！清华通院联合推出心智理论新框架，六个指标评估表现均明显优于思维链

清华自动化系团队联合北京通用人工智能研究院，让几个AI智能体玩起了桌游！游戏名叫阿瓦隆，是一个策略性的社交推理游戏，玩家被隐秘地分为“正义”与“邪恶”两派，通过任务投票、互相猜测与欺骗来完成或阻止任务，最终确定胜负。为了能让AI智能体成功识别并应...

AIGC 2023-10-31 人工智能

913阅读

阿里云发布通义千问2.0，性能超GPT-3.5，加速追赶GPT-4

10月31日，阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中，通义千问2.0综合性能超过GPT-3.5，正在加速追赶GPT-4。当天，通义千问APP在各大手机应用市场正式上线，所有人都可通过APP直接体验最新模型能力。过去6个月，通义...

AIGC 2023-10-31 人工智能

881阅读

图模型也要大？清华朱文武团队有这样一些观点

在大模型时代，图机器学习面临什么样的机遇和挑战？是否存在，并该如何发展图的大模型？针对这一问题，清华大学朱文武教授团队首次提出图大模型（Large Graph Model）概念，系统总结并梳理了图大模型相关的概念、挑战和应用；进一步围绕动态性和可解释性，...

AIGC 2023-10-31 人工智能

980阅读

ChatGPT、Llama-2等大模型，能推算出你的隐私数据！

ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据，就能推算出你的住址、年龄、性别、职业、收入等隐私数据。瑞士联邦理工学院通过搜集并手工标注了包含520个Reddit（知名论坛）用户的个人资料真实数据集PersonalReddi...

人工智能 2023-10-31 人工智能

853阅读

科学春晚，还得是B站：稚晖君机械臂搭广寒宫，院士下半身直接消失

听闻B站要搞一场科学春晚——超级科学晚。这种热闹，我们必然火速赶到第一现场来感受感受。作为一场科学为主题的晚会，最值得关注的自然是在晚会中展示的一个个创意实验。最令现场“wow”声一片的，是中国科学院院士褚君浩解释葫芦娃六娃的隐身秘诀。还原地演示了...

人工智能 2023-10-30 人工智能

921阅读

像搭乐高一样做数学定理证明题，GPT-3.5证明成功率达新SOTA

背景作为长链条严格推理的典范，数学推理被认为是衡量语言模型推理能力的重要基准，GSM8K 和 MATH 等数学文字问题（math word problem）数据集被广泛应用于语言模型的测评和比较中。事实上，数学作为一项科学研究并不仅仅包括计算具体实例，...

人工智能 2023-10-30 人工智能

912阅读

百度Chat文心一言app是什么？百度ChatAI下载

百度于 3 月 16 日发布了知识增强大语言模型文心一言，该模型是文心大模型3. 5 的升级版本。文心一言是中国公众最早能够体验测试的AI大模型之一，也是在大模型中表现出色的一款。它已经被广泛应用于日常文案创作、信息搜索、图案设计等领域。百度首席技术官王海...

人工智能 2023-10-30 人工智能

931阅读

AI视野：百川发布Baichuan2-192K大模型；DALL·E3新增种子功能；ChatGPT Plus会员可上传和分析文件；谷歌Bard支持实时生成回复

????大模型动态百川智能发布Baichuan2-192K大模型，可处理35万汉字百川智能发布了Baichuan2-192K大模型，拥有全球最长的上下文窗口，处理约35万个汉字，超越了Claude2。百川大模型官网:https://top.aibas...

AIGC 2023-10-30 人工智能

954阅读

多模态大模型幻觉降低30%！中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

视觉幻觉是常见于多模态大语言模型（Multimodal Large Language Models, MLLMs）的一个典型问题。简单来说就是：模型输出的描述与图片内容不相符。下图中体现了两种幻觉，红色部分错误地描述了狗的颜色（属性幻觉），蓝色部分描...

AIGC 2023-10-30 人工智能

1116阅读

剖析纽约市AI计划，我们能从中学习什么？

市长Eric Adams日前公布了纽约市政府推广AI技术的应用计划。尽管仍面对一定质疑，但该计划仍提出了值得全美各州及地方政府认真思考的一系列重要概念。 AI科技与地方政府目前，对AI经济影响力的大多数关注主要集中在商业领域，但政府也有借此广泛提高生...

人工智能 2023-10-30 人工智能

912阅读

世界模型和DriveGPT这类大模型到底能给自动驾驶带来什么？

本文经自动驾驶之心公众号授权转载，转载请联系出处。大模型今年爆火，很多领域上的应用如雨后春笋般涌现，很多优秀的工作出现，主要集中在数据生成和场景分析表述两部分，重点解决自动驾驶的长尾分布问题和场景识别。今天自动驾驶之心带大家梳理下自动驾驶行业上的大模...

AIGC 2023-10-30 人工智能

1164阅读

龙与地下城：大模型文字游戏之路

作者 | 崔皓审校 | 重楼摘要本文作者受到一位国外博主的启发，决定尝试使用大语言模型创建一个地下城文字游戏。通过大语言模型生成富有创意和连贯性的游戏内容。他的游戏灵感主要来源于经典的桌面角色扮演游戏“龙与地下城”（D&D）。该游戏通过对话...

人工智能 2023-10-30 人工智能

1812阅读

百度王海峰：文心大模型4.0推理性能提升50倍

在近日的第二十届中国计算机大会上，百度首席技术官王海峰表示，百度在3月16日发布知识增强大语言模型文心一言，目前文心一言的基础模型已迭代到文心大模型4.0版本。知识增强大语言模型从数万亿数据和数千亿知识中融合学习，得到预训练大模型，在此基础上采用有监督精调...

人工智能 2023-10-30 人工智能

818阅读

最好7B模型再易主！打败700亿LLaMA2，苹果电脑就能跑

花500刀“调教”的70亿参数模型，打败700亿参数的Llama 2！且笔记本就能轻松跑，效果媲美ChatGPT。重点：免费、不要钱。 HuggingFace H4团队打造的开源模型Zephyr-7B，鲨疯了。其底层模型是前段时间爆火、由有着“欧...

AIGC 2023-10-29 人工智能

1162阅读

小模型如何比肩大模型，北理工发布明德大模型MindLLM，小模型潜力巨大

大型语言模型 (LLMs 在各种自然语言任务中展现出了卓越的性能，但是由于训练和推理大参数量模型需要大量的计算资源，导致高昂的成本，将大语言模型应用在专业领域中仍存在诸多现实问题。因此，北理团队先从轻量级别模型入手，最大程度发挥数据和模型的优势，立足更...

AIGC 2023-10-28 人工智能

1069阅读

港大等发布GraphGPT：1/50微调参数，准确率提升10倍！无需超长token，LLM也能读懂图结构

图神经网络（Graph Neural Networks）已经成为分析和学习图结构数据的强大框架，推动了社交网络分析、推荐系统和生物网络分析等多个领域的进步。图神经网络的主要优势在于它们能够捕获图数据中固有的结构信息和依赖关系。利用消息传递和聚合机制，图...

AIGC 2023-10-28 人工智能

975阅读

波士顿动力机器狗变“导游”：接入ChatGPT对答如流

快科技10月27日消息，全球顶级机器人开发商波士顿动力（Boston Dynamics）在官网宣布，通过将ChatGPT、Spot以及其他AI模型相结合，开发了一种会说话的导游机器狗。据了解，为了让Spot开口说话，波士顿动力公司使用了OpenAI的Ch...

人工智能 2023-10-28 人工智能

908阅读

将ChatGPT与物理机器人结合，波士顿动力开发了一只怪物！

10月27日，全球顶级机器人开发商波士顿动力（Boston Dynamics）在官网展示了一项新的研究，通过将ChatGPT、Spot以及其他AI模型相结合，开发了一种会说话的导游机器狗。据悉，该机器狗能够根据文字、语音提示与人类进行交谈，同时提供了视觉...

人工智能 2023-10-27 人工智能

906阅读

利用 ChatGPT 等大模型训练，波士顿动力将 Spot 机器狗变成“会说话的导游”

▲ 图源波士顿动力公司 YouTube 视频截图 10 月 27 日消息，波士顿动力公司于数小时前在其官方 YouTube 频道上传了一段视频，展示了波士顿动力机器狗的“语言能力”。视频中，波士顿动力机器狗化身“导游”带领工作人员参观自家公司的各种设施。...

AIGC 2023-10-27 人工智能

792阅读

吃“有毒”数据，大模型反而更听话了！来自港科大&华为诺亚方舟实验室

现在，大模型也学会“吃一堑，长一智”了。来自香港科技大学和华为诺亚方舟实验室的最新研究发现：相比于一味规避“有毒”数据，以毒攻毒，干脆给大模型喂点错误文本，再让模型剖析、反思出错的原因，反而能够让模型真正理解“错在哪儿了”，进而避免胡说八道。具体...

人工智能 2023-10-27 人工智能

800阅读

35年首次证明，NYU重磅发现登Nature：神经网络具有类人泛化能力，举一反三超GPT-4

【新智元导读】Nature刊登了纽约大学等机构的研究人员在人工智能领域最新突破，证明神经网络具有类似人类语言的泛化性能，再一次印证了AI发展的无限潜力! 35年来，认知科学、人工智能、语言学和哲学领域的研究人员一直在争论神经网络是否能实现类似人类的系统泛...

人工智能 2023-10-27 人工智能

843阅读