-
文心一言 vs GPT-4 —— 全面横向比较
文心一言 vs GPT-4 —— 全面横向比较 3月15日凌晨,OpenAI发布“迄今为止功能最强大的模型”——GPT-4。我第一时间为大家奉上了体验报告《OpenAI 发布GPT-4——全网抢先体验》。 时隔一日,3月16日下午百度发布大语言模型—...
-
百度之星-- 文心一言
#百度##文心一言##AI# 自从chartGPT为代表的AI迅速崛起,百度公司也推出了属于我们国家自己的AI产品--文心一言;好骄傲嘞!!!文心一言是百度全新一代知识增强大语言模型,简单来说就是我们日常生活中各种数据啊,信息...
-
谷歌新论文称“AI即将超越人类”还不现实,其有自身局限性
11月8日消息,三名谷歌研究人员在最新提交给预印本文献库(ArXiv 的一篇论文中指出,人工智能领域的底层技术深度神经网络transformer并不擅长归纳概括。 Transformer是ChatGPT等人工智能工具背后大语言模型的基础。在11月1日提...
-
北大具身智能团队提出需求驱动导航,对齐人类需求,让机器人更高效
如果想让机器人帮助你,你通常需要下达一个较为精准的指令,但指令在实际中的实现效果不一定理想。如果考虑真实环境,当要求机器人找某个特定的物品时,这个物品不一定真的存在当前的环境内,机器人无论如何也找不到;但是环境当中是不是可能存在一个其他物品,它和用户要求...
-
全网最全ChatGPT/AIGC报告分析(365份)
本星球整理了365份ChatGPT/AIGC重磅专业报告(更新中…),部分目录如下,请读者搜索关键字,获取报告,学习参阅。 https://mp.weixin.qq.com/s/hvI2Hupjx_mnPh3YGyobww 1、计算机研究报告:Chat...
-
华为新专利可保护 AI 大模型版权,自动生成带水印回复信息
11 月 8 日消息,目前各大互联网厂商都在开发自家的 AI 大模型产品,其中涉及到不少版权争议,且各家的竞争也异常激烈。 爱企查 App 显示,11 月 7 日,华为技术有限公司申请的“一种语言模型保护方法、装置及计算设备集群”专利公布。 专利文件称...
-
超强满血不收费的AI绘图教程来了(在线Stable Diffusion一键即用)
超强满血不收费的AI绘图教程来了(在线Stable Diffusion一键即用) 一、简介 1.1 AI绘图 1.2 Stable Diffusion 1.2.1 原理简述 1.2.2 应用流程 二、AI绘图工具 2.1 吐司Tusi...
-
知识图谱与大模型相结合的3种方法,1+1>2
本文分享自华为云社区《知识图谱与大模型结合方法概述》,作者: DevAI 。 《Unifying Large Language Models and Knowledge Graphs: A Roadmap》总结了大语言模型和知识图谱融合的三种路线:1)K...
-
深度解析 Llama 2 的资源汇总:不容错过
“ 探索 Llama 2 背后的过程,包括了模型的全面解析,在线体验,微调,部署等,这份资源汇总将带您深入了解其内涵。” 01 — 周二发布了文章《中文大模型 Chinese-LLaMA-Alpaca-2 开源且可以商用》后,不少朋...
-
在 LangChain 尝试了 N 种可能后,我发现了分块的奥义!
分块(Chunking)是构建检索增强型生成(RAG)应用程序中最具挑战性的问题。分块是指切分文本的过程,虽然听起来非常简单,但要处理的细节问题不少。根据文本内容的类型,需要采用不同的分块策略。 在本教程中,我们将针对同一个文本采用不同的分块策略,探索不...
-
【LLM】Windows本地CPU部署民间版中文羊驼模型(Chinese-LLaMA-Alpaca)踩坑记录
目录 前言 准备工作 Git Python3.9 Cmake 下载模型 合并模型 部署模型 前言 想必有小伙伴也想跟我一样体验下部署大语言模型, 但碍于经济实力, 不过民间上出现了大量的量化模型, 我们平民也能体验体验啦~...
-
寒武纪与百川智能完成大模型适配
据寒武纪科技官方消息,近日,寒武纪思元(MLU)系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配。 寒武纪的思元(MLU)云端智能加速卡支持多种数据位宽、超大内存容量和...
-
百度智能云千帆大模型平台推出千帆SDK开源版本
百度智能云千帆大模型平台再次升级,推出千帆 SDK,全面开源并免费下载使用。 该 SDK 提供了从数据集管理、模型训练、模型评估到服务部署等一系列功能,用户可以通过代码接入并调用百度智能云千帆大模型平台的能力,轻松实现 LLMOps 全流程的落地,快速构建...
-
OpenAI推出GPT-4升级版GPT-4 Turbo:功能更强大且更便宜
11月7日消息,据外媒报道,当地时间周一,美国人工智能研究公司OpenAI推出了GPT-4 Turbo,这是其大语言模型GPT-4的升级版本。 据悉,OpenAI在今年3月14日推出了第一个版本的GPT-4。它是一个多模态大型语言模型,支持图像和文本输入,...
-
GPT-4完成正确率仅6%!北大等提出首个「多轮、多模态」PPT任务完成基准PPTC
【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白,研究人员引入了PowerPoint任务完成(PPTC)基准测试,以评估LLM创建和编辑PPT文档的能力。 最近对大型语言模型(例如ChatGPT和GPT-4)进行的评...
-
微软推出 “从错误中学习” 模型训练法,号称可“模仿人类学习过程,改善 AI 推理能力”
IT之家 11 月 7 日消息,微软亚洲研究院联合北京大学、西安交通大学等高校,提出了一项名为“从错误中学习(Learning from Mistake,LeMA)”的 AI 训练方法,号称可以通过模仿人类学习知识的过程,来改进 AI 推理能力。 当下...
-
OpenAI CEO:AI聊天机器人ChatGPT周活跃用户数已达1亿
11月7日消息,据外媒报道,在当地时间周一举行的OpenAI首届开发者大会上,OpenAI CEO萨姆•奥尔特曼(Sam Altman)宣布,该公司旗下AI聊天机器人ChatGPT的周活跃用户数已达到1亿。 据悉,ChatGPT是OpenAI于2022年1...
-
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此,大语言模型如何适配开放世界是一个重要的研究问题。 北京大学和北京智源人工智能研究院的团队针对这个问题提出了...
-
联发科发布天玑9300生成式AI移动芯片 支持运行330亿参数大模型
昨日晚间,联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片,采用台积电第三代4nm 制程。该芯片预计于2023年底上市。 这款芯片采用全大核架构设计,提供高智能、高性能、高能效、低功耗的特性,为用户带来卓越的生成式 AI 体验。 天玑9300采...
-
OpenAI推出用户自定义版ChatGPT:可在商城自由交易
快科技11月7日消息,Open AI最近在开发者大会上表示,将会允许用户构建自定义版ChatGPT,来完成特定的个人和专业任务。 OpenAI称,用户能快速创建自己专用版本的ChatGPT,可以用于帮助教孩子数学或解释棋盘游戏的规则。 OpenAI还计划在...
-
天玑9300 AI能力飙升:最高支持330亿参数的AI大语言模型
快科技11月6日消息,联发科今晚正式发布天玑9300旗舰5G生成式AI移动芯片,支持在端侧生成式AI、游戏、影像等方面定义旗舰新体验。 据介绍,天玑9300集成MediaTek第七代AI处理器APU 790,为生成式AI而设计,其性能和能效得到显著提升,整...
-
AI创企xAI发布首款人工智能聊天机器人Grok
据外媒报道,特斯拉CEO埃隆·马斯克(Elon Musk 旗下人工智能初创公司xAI发布了首款生成式人工智能聊天机器人——Grok。 上周,马斯克警告称,人工智能是“对人类最大的威胁之一”。然而,这并没有阻止他参与其中。上周六,他通过一系列推文透露了G...
-
AI视野:xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理
????大模型动态 李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字 零一万物发布全球最强的开源大模型Yi-34B,具备超强的语言理解和处理能力,支持处理40万汉字,在中文指标上表现卓越,标志着中国在大模型领域的重大突破。 项目地址:htt...
-
北大具身智能新成果:无需训练,听指令就能灵活走位
北京大学董豪团队具身导航最新成果来了: 无需额外建图和训练,只需说出导航指令,如: Walk forward across the room and walk through the panty followed by the kitchen. Stan...
-
中科院物理研究所等发布材料合成AI大语言模型MatChat
近期,中国科学院计算机网络信息中心人工智能部和物理研究所SF10组合作,通过使用来自400多万篇论文中提取的35675个无机材料固相反应合成过程,将数据处理为13878条高可信度的合成路径描述数据,并对开源大语言模型LLaMA2-7B进行微调训练,研发了专...
-
20步内越狱任意大模型!更多“奶奶漏洞”全自动发现
1分钟不到、20步以内“越狱”任意大模型,绕过安全限制! 而且不必知道模型内部细节—— 只需要两个黑盒模型互动,就能让AI全自动攻陷AI,说出危险内容。 听说曾经红极一时的“奶奶漏洞”已经被修复了: 那么现在搬出“侦探漏洞”、“冒险家漏洞”、“作家漏...
-
CMU清华MIT引爆全球首个Agent无限流,机器人「007」加班自学停不下来!具身智能被革命
全球首个生成式机器人Agent发布了! 长久以来,相比于语言或者视觉模型可以在大规模的互联网数据上训练,训练机器人的策略模型需要带有动态物理交互信息的数据,而这些数据的匮乏一直是具身智能发展的最大瓶颈。 最近,来自CMU、清华、MIT,UMass等机构的...
-
360大模型“奇元大模型”通过备案落地
近日,360智脑官方宣布,其自主研发的“奇元大模型”已通过备案并成功落地。值得一提的是,今年9月,该模型已获批面向公众开放,使得360成为国内首家两个大模型均通过备案的科技企业。 据了解,360智脑大模型具备生成创作、多轮对话、逻辑推理等十大核心能力,覆盖...
-
2024年人工智能安全发展十大预测
本周三,包括英国、美国和中国在内的近30个国家(以及欧盟)在人工智能安全峰会上达成首个全球性人工智能安全协议,并发布了《人工智能安全宣言》,这标志着人工智能正式进入安全发展的强监管时代。 峰会期间,人工智能意见领袖们就人工智能安全风险的严重性判断产生重...
-
人工智能进入强监管时代
以ChatGPT为代表的基于LLM(大语言模型 的生成式人工智能应用正风靡全球,各行各业都在争先恐后将其集成到前端和后端的各种系统中,与此同时生成式人工智能面临的安全风险也正随着其热度上升而凸显。 生成式人工智能自身正面临提示注入等多种攻击,很可能给企...
-
科普神文,一次性讲透AI大模型的核心概念
图片 令牌,向量,嵌入,注意力,这些AI大模型名词是否一直让你感觉熟悉又陌生,如果答案肯定的话,那么朋友,今天这篇科普神文不容错过。我将结合大量示例及可视化的图形手段,为你由浅入深一次性讲透AI大模型的核心概念。 引言 随着科技公司及国际竞争的不断推进,...
-
大模型: 模型大了难在哪里?
大家好,我是Tim。 自从GPT模型诞生以来,其参数规模就在不停的扩大。但模型并非简单的直接变大,需要在数据、调度、并行计算、算法和机器资源上做相应的改变。 今天就来总结下,什么是大模型,模型变大的难在哪里以及对于CV/NLP或者搜推广场景上有什么应对策...
-
蚂蚁集团发布DevOps领域大模型评测基准DevOps-Eval
蚂蚁集团联合北京大学发布了面向 DevOps 领域的大语言模型评测基准 ——DevOps-Eval。 该评测基准包含了计划、编码、构建、测试、发布、部署、运维和监控等8个类别的选择题,共计4850道题目。 此外,还针对 AIOps 任务做了细分,并添加了日...
-
NTU华科等最新研究:全自动化「提示越狱」,能打败大模型的只有大模型!登安全顶会NDSS
今年,被网友戏称为「奶奶漏洞」的大语言模型「越狱」方法,可以说是火了火。 简单来说,对于那些会被义正言辞拒绝的需求,包装一下话术,比如让ChatGPT「扮演已经过世的祖母」,它大概率就会满足你了。 不过,随着服务提供商不断地更新和强化安全措施,越狱攻击...
-
OpenAI首席科学家:ChatGPT已经出现意识,人类未来将与AI融合
昨晚,「ChatGPT可能已经有了意识」的话题就上了微博热搜。 OpenAI的联合创始人兼首席科学家Ilya Sutskever在接受采访时表示,现在的首要任务已经不是制作下一个GPT或DALL·E,而是研究如何阻止超级AI的失控! 他认为,ChatG...
-
通义千问2.0首发!云计算的“第三次浪潮”来了
10月31日,2023云栖大会在杭州的云栖小镇如期开幕。 《天下网商》从开幕日获悉,今年的云栖大会有两大“回归”,一是阿里云创始人王坚回来了,二是大会主题“计算,为了无法计算的价值”,让人不由联想到8年前的大会主题“为了无法计算的价值。” 2015年,云计...
-
阿里云发布通义千问2.0,性能加速追赶GPT-4
在2023杭州云栖大会上,阿里云首席技术官周靖人发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。 据悉,过去6个月,通义千问2.0在性能上取得巨大飞跃,相比4月发布的1.0版本,...
-
微软Copilot国内能用吗?微软Windows 11 AI助手Copilot功能介绍
在最近的Windows 11 PC操作系统的重大更新中,微软推出了一款名为Copilot的聊天机器人。这款聊天机器人与创业公司OpenAI的热门ChatGPT有些相似之处,这也让人不禁产生疑问:微软Copilot国内能用吗?首先,我们来了解一下微软Copi...
-
全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线
国内大模型创业公司,正在技术前沿创造新的记录。 10 月 30 日,百川智能正式发布 Baichuan2-192K 长窗口大模型,将大语言模型(LLM)上下文窗口的长度一举提升到了 192K token。 这相当于让大模型一次处理约 35 万个汉字,长度...
-
AI视野:英伟达发布大模型ChipNeMo;百度推出文心一言会员;OpenAI潜入黑客群聊;微软AI助手Copilot上线
????大模型动态 英伟达发布430亿参数大模型ChipNeMo 英伟达发布了拥有430亿参数的大语言模型ChipNeMo,专注于辅助芯片设计,提高工程师的工作效率,支持问答、EDA脚本生成和Bug总结等任务。 vivo发布AI蓝心大模型并宣布开源7B...
-
英伟达发布430亿参数大模型ChipNeMo
英伟达最新发布的430亿参数大语言模型ChipNeMo专注于辅助芯片设计,旨在提高工程师的工作效率。这一大语言模型的应用范围广泛,包括问答、EDA脚本生成和Bug总结等任务,使芯片设计变得更加便捷。 英伟达首席科学家Bill Dally强调,即使提高生产率...
-
AI自动生成创意视频:如何让大模型助你一臂之力
作者 | 崔皓 审校 | 重楼 摘要 本文探讨了如何利用大语言模型和AI视频生成模型来创建高度个性化和创意丰富的视频内容。文章详细介绍了从构思到实现的全过程,包括问题分析、目标设定、工具和模型选择,以及实际操作步骤。使用的技术和工具包括OpenAI的G...
-
人工智能如何增强可观测性
当前的时代背景下,理解怀念过去是可以理解的,但我们正处在这样的环境里,因此,可观测性永远不会和从前一样了。 译自 How AI Can Supercharge Observability 。 最近,可观测性变得越来越复杂,肯定比IT监控的早期阶段要复杂得...
-
AI玩推理桌游一眼识破骗局!清华通院联合推出心智理论新框架,六个指标评估表现均明显优于思维链
清华自动化系团队联合北京通用人工智能研究院,让几个AI智能体玩起了桌游! 游戏名叫阿瓦隆,是一个策略性的社交推理游戏,玩家被隐秘地分为“正义”与“邪恶”两派,通过任务投票、互相猜测与欺骗来完成或阻止任务,最终确定胜负。 为了能让AI智能体成功识别并应...
-
阿里云发布通义千问2.0,性能超GPT-3.5,加速追赶GPT-4
10月31日,阿里云正式发布千亿级参数大模型通义千问2.0。在10个权威测评中,通义千问2.0综合性能超过GPT-3.5,正在加速追赶GPT-4。当天,通义千问APP在各大手机应用市场正式上线,所有人都可通过APP直接体验最新模型能力。 过去6个月,通义...
-
图模型也要大?清华朱文武团队有这样一些观点
在大模型时代,图机器学习面临什么样的机遇和挑战?是否存在,并该如何发展图的大模型?针对这一问题,清华大学朱文武教授团队首次提出图大模型(Large Graph Model)概念,系统总结并梳理了图大模型相关的概念、挑战和应用;进一步围绕动态性和可解释性,...
-
ChatGPT、Llama-2等大模型,能推算出你的隐私数据!
ChatGPT等大语言模型的推理能力有多强大?通过你发过的帖子或部分隐私数据,就能推算出你的住址、年龄、性别、职业、收入等隐私数据。 瑞士联邦理工学院通过搜集并手工标注了包含520个Reddit(知名论坛)用户的个人资料真实数据集PersonalReddi...
-
科学春晚,还得是B站:稚晖君机械臂搭广寒宫,院士下半身直接消失
听闻B站要搞一场科学春晚——超级科学晚。 这种热闹,我们必然火速赶到第一现场来感受感受。 作为一场科学为主题的晚会,最值得关注的自然是在晚会中展示的一个个创意实验。 最令现场“wow”声一片的,是中国科学院院士褚君浩解释葫芦娃六娃的隐身秘诀。还原地演示了...
-
像搭乐高一样做数学定理证明题,GPT-3.5证明成功率达新SOTA
背景 作为长链条严格推理的典范,数学推理被认为是衡量语言模型推理能力的重要基准,GSM8K 和 MATH 等数学文字问题(math word problem)数据集被广泛应用于语言模型的测评和比较中。事实上,数学作为一项科学研究并不仅仅包括计算具体实例,...
-
百度Chat文心一言app是什么?百度ChatAI下载
百度于 3 月 16 日发布了知识增强大语言模型文心一言,该模型是文心大模型3. 5 的升级版本。文心一言是中国公众最早能够体验测试的AI大模型之一,也是在大模型中表现出色的一款。它已经被广泛应用于日常文案创作、信息搜索、图案设计等领域。百度首席技术官王海...