-
文心一言Plugin实战来了,测试开发旅游攻略助手
刚刚过去的8月,百度WAVE SUMMIT 深度学习开发者大会上,重磅发布文心一言的五个原生插件:百度搜索、览卷文档(基于文档的交互)、E 言易图(数据洞察图表生成)、说图解画(基于图片的交互)、一镜流影(文字转视频)。 我们知道大模型的训练过程一般...
-
实测文心一言4.0,真的比GPT-4毫不逊色吗?
10月17日,李彦宏在百度世界2023上表示。当天,李彦宏以《手把手教你做AI原生应用》为主题发表演讲,发布文心大模型4.0版本。 今天,咱们就开门见山啊。这一回要测一测,昨天才发布的文心一言大模型 4.0。 之所以要测它,是因为李彦宏昨天在会上说的那...
-
让大模型分析csdn文章质量 —— 提取csdn博客评论在文心一言分析评论区内容
文章目录 ⭐前言 ⭐技术栈选择 ⭐前端页面搭建 ⭐后端获取数据暴露接口 ?requests获取数据 ? django 抛出api 接口 ⭐效果 ⭐结束 ⭐前言 大家好,我是yma16,本文分享关于 让大模型分析csdn文章质量...
-
万万没想到,我用文心一言开发了一个儿童小玩具
最近关注到一年一度的百度世界大会今年将于10月17日在北京首钢园举办,本期大会的主题是“生成未来(PROMPT THE WORLD)”。会上,李彦宏会做主题为「手把手教你做AI原生应用」的演讲,比较期待 Robin 会怎么展示。据说,大会当天百度还会发布文...
-
DeepMind指出「Transformer无法超出预训练数据实现泛化」,但有人投来质疑
距离马斯克的 xAI 公布 Grok 才过去一天,刚刚,xAI 又公布了另一款 AI 产品,一个可用于 prompt 工程和可解释性研究的集成开发环境:PromptIDE。 接连不断的新品发布,也让网友纷纷感叹:「xAI 团队的开发速度简直是疯了!」...
-
如何高效训练?综述汇总:大型深度学习训练的并行分布式系统
本文经自动驾驶之心公众号授权转载,转载请联系出处。 23年1月论文“Systems for Parallel and Distributed Large-Model Deep Learning Training“, 来自UCSD。 深度学习(DL)已经...
-
思谋科技发布全球首个工业多模态大模型 IndustryGPT V1.0
思谋科技在第六届中国国际进口博览会上发布了全球首个工业多模态大模型 IndustryGPT V1.0。 这个大模型通过深度的行业洞察和海量的精炼数据,能够准确回答制造业的问题、识别工业缺陷,并提供决策支持。 与此同时,思谋科技还与松下、江森自控等跨国企业...
-
寒武纪与百川智能完成大模型适配
据寒武纪科技官方消息,近日,寒武纪思元(MLU)系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配。 寒武纪的思元(MLU)云端智能加速卡支持多种数据位宽、超大内存容量和...
-
你知道程序员再过几年会没落?
《Computer World》杂志曾经写过一篇文章,说“编程到1960年就会消失”,因为IBM开发了一种新语言FORTRAN,这种新语言可以让工程师写出他们所需的数学公式,然后提交给计算机运行,所以编程就会终结。 图片 又过了几年,我们听到了一种新...
-
百度智能云千帆大模型平台推出千帆SDK开源版本
百度智能云千帆大模型平台再次升级,推出千帆 SDK,全面开源并免费下载使用。 该 SDK 提供了从数据集管理、模型训练、模型评估到服务部署等一系列功能,用户可以通过代码接入并调用百度智能云千帆大模型平台的能力,轻松实现 LLMOps 全流程的落地,快速构建...
-
马斯克版ChatGPT背后开发工具上线!xAI产品两连发,网友:交付速度太疯狂
马斯克版ChatGPT才刚吸引一波眼球,xAI第二款大模型产品就突然登场了! 就在刚刚,马斯克旗下xAI官宣:推出PromptIDE。 一个用于提示工程和可解释性研究的集成开发环境。 xAI表示,他们打造PromptIDE的最初目的,是加速其聊天AI机...
-
北大推出首个多轮多模态PPT任务完成基准PPTC GPT-4完成正确率仅6%
北大和微软亚洲研究院的研究人员提出了一项新的评估基准PPTC,旨在评估大型语言模型在复杂多轮多模态PPT任务中的表现。 他们通过创建包含数百个多模态指令的数据集,挑战大模型在多轮人机对话中生成PPT文档的能力。结果显示,GPT-4在创建新PPT文档任务中表...
-
百度网盘首页全新改版:个人文档feed流推荐、大模型加持2步内完成所有操作
10月17日在2023百度世界大会上,百度创始人、董事长兼首席执行官李彦宏表示,重构后的百度网盘,不但实现了从图形界面交互到自然语言交互的转变,还增强了多模态信息理解。据了解,自2012年上线至今,百度网盘已积累8亿用户,文件量级达4万亿,每天用户会上传...
-
OpenAI推出GPT-4升级版GPT-4 Turbo:功能更强大且更便宜
11月7日消息,据外媒报道,当地时间周一,美国人工智能研究公司OpenAI推出了GPT-4 Turbo,这是其大语言模型GPT-4的升级版本。 据悉,OpenAI在今年3月14日推出了第一个版本的GPT-4。它是一个多模态大型语言模型,支持图像和文本输入,...
-
GPT-4完成正确率仅6%!北大等提出首个「多轮、多模态」PPT任务完成基准PPTC
【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白,研究人员引入了PowerPoint任务完成(PPTC)基准测试,以评估LLM创建和编辑PPT文档的能力。 最近对大型语言模型(例如ChatGPT和GPT-4)进行的评...
-
深夜炸场,ChatGPT一周年:无需编程,全民定义GPT的时代,来了!
撰稿 | 云昭 深夜又是一场王炸!在ChatGPT发布一周年之际,OpenAI 创始人Altman 在首届开发者大会上全场放大招,台下掌声不断。 无需编程,甚至无需敲键盘,单纯通过语音聊天就能构建一个专属自定义的GPT!这个消息实在太燃了!以至于推特...
-
科普神文,GPT背后的Transformer模型
上次《解读AI大模型,从了解token开始》一文中,我从最基础的概念“token”着手,跳过了复杂的算法逻辑,相信已经让大家建立起对AI大模型工作原理的清晰认知。 但如果仅仅只是依靠对文本的编码与数据分析,那人工智能时代应该早就到来了,为什么唯独是GPT...
-
AI视野:OpenAI发布GPT-4Turbo;xAI推出PromptIDE工具;美团首个AI产品“Wow”亮相;百家号AI笔记功能将下线
???AI新鲜事 OpenAI发布GPT-4Turbo和自定义GPTs服务 在OpenAI首届开发者大会DevDay活动上,OpenAI发布了GPT-4Turbo模型和自定义GPTs服务,以及其他新功能和API,如Assistants API和新的模态AP...
-
微软推出 “从错误中学习” 模型训练法,号称可“模仿人类学习过程,改善 AI 推理能力”
IT之家 11 月 7 日消息,微软亚洲研究院联合北京大学、西安交通大学等高校,提出了一项名为“从错误中学习(Learning from Mistake,LeMA)”的 AI 训练方法,号称可以通过模仿人类学习知识的过程,来改进 AI 推理能力。 当下...
-
OpenAI CEO:GPT-4周活用户数达1亿,仍是世界上能力最强AI大模型
11月7日消息,美国当地时间周一,在OpenAI首届开发者大会上,该公司首席执行官萨姆·奥特曼(Sam Altman)宣布,ChatGPT的周活用户数达到1亿。奥特曼还特别提到“公司在今年3月发布的GPT-4,至今仍是世界上能力最强的AI大模型”。 自...
-
百度百家号:度加创作工具平台“AI笔记”功能将下线
百度百家号发布《关于度加创作工具平台【AI笔记】下线通知》称,由于业务升级调整,将于2023年11月30日起对度加创作工具平台-【AI笔记】功能进行下线,其他功能不受影响,仍可正常使用。 创作者在下线前,需要及时备份未发布的笔记草稿,下线后未发布的笔记草稿...
-
让大模型自主探索开放世界,北大&智源提出训练框架LLaMA-Rider
大语言模型因其强大而通用的语言生成、理解能力,展现出了成为通用智能体的潜力。与此同时,在开放式的环境中探索、学习则是通用智能体的重要能力之一。因此,大语言模型如何适配开放世界是一个重要的研究问题。 北京大学和北京智源人工智能研究院的团队针对这个问题提出了...
-
联发科发布天玑9300生成式AI移动芯片 支持运行330亿参数大模型
昨日晚间,联发科技发布了天玑9300旗舰5G 生成式 AI 移动芯片,采用台积电第三代4nm 制程。该芯片预计于2023年底上市。 这款芯片采用全大核架构设计,提供高智能、高性能、高能效、低功耗的特性,为用户带来卓越的生成式 AI 体验。 天玑9300采...
-
独家|美团首个AI产品“Wow”亮相,押注交互伴聊
美团AI产品首发,切入交互聊天赛道 Tech星球体验发现,Wow是一款AI伴聊产品,这是AI的一个主流应用场景。目前已经有腾讯音乐的“未伴”、百度的“小侃星球”等类似产品相继面世。 Wow的产品设计较为简洁,整个产品由聊天、发现和个人中心三个Tab标签。...
-
ChatGPT王炸升级!更强版GPT-4上线,API定价打骨折,发布现场掌声没停过
ChatGPT,今天裂变成无数个GPT。 OpenAI在首届开发者日上,正式公布自定义GPT。 还将上线“GPT商店”,与创作者分享收入。 CEO山姆·奥特曼现场登台演示,3分钟不到,只凭几步操作做好一个“创业导师GPT”。 接下来,“创业导师GPT...
-
天玑9300 AI能力飙升:最高支持330亿参数的AI大语言模型
快科技11月6日消息,联发科今晚正式发布天玑9300旗舰5G生成式AI移动芯片,支持在端侧生成式AI、游戏、影像等方面定义旗舰新体验。 据介绍,天玑9300集成MediaTek第七代AI处理器APU 790,为生成式AI而设计,其性能和能效得到显著提升,整...
-
让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)
最近微软一项研究让Llama 2选择性失忆了,把哈利波特忘得一干二净。 现在问模型“哈利波特是谁?”,它的回答是这样婶儿的: 木有赫敏、罗恩,木有霍格沃茨…… 要知道此前Llama 2的记忆深度还是很给力的,比如给它一个看似非常普通的提示“那年秋天,哈...
-
号称和GPT-4持平!知乎大模型“知海图AI”将正式开放
快科技11月6日消息,近日知乎宣布其知海图AI”大模型将面向公众开放,并择机上线相关产品,以提供服务给创作者、讨论场所、信息获取者以及内容运营者等各类型用户。 据介绍,知海图AI”大模型的训练主要是基于CPM企业级大模型与ModelForce大模型系统,拥...
-
GPU推理提速4倍!FlashDecoding++技术加速大模型推理
推理大模型(LLM)是AI服务提供商面临的巨大经济挑战之一,因为运营这些模型的成本非常高。FlashDecoding++ 是一种新的技术,旨在解决这一问题,它通过提高LLM推理速度和降低成本,为使用大模型赚钱提供了新的可能性。 论文地址:https://...
-
华为盘古铁路大模型显威:效率比人工提升2倍
快科技11月6日消息,在OpenAI发布ChatGPT后,全球已发布数百个大模型。 其中华为的盘古大模型号称不作诗只做事”,聚焦价值场景,致力于深耕政务、金融、制造、煤矿、铁路、制药、气象等行业。 近日,华为就介绍了华为盘古铁路大模型,相比人工作业,工作效...
-
xAI Grok内测资格在哪里申请 Grok资格申请入口介绍
马斯克近日正式宣布推出xAI Grok大模型,这是xAI团队发布的首个AI大模型产品。据xAI的声明称,该产品“有智慧,还有叛逆的性格”,并且能回答被大多数其他AI系统拒绝的辛辣问题。 xAI Grok现在已经可以进行内测资格申请(点击进入),用户可在官...
-
AI视野:xAI首个大模型Grok炸场;李开复官宣开源大模型Yi-34B;ChatGPT原型Gizmo新功能曝光;百度网盘引入大模型智能助理
????大模型动态 李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字 零一万物发布全球最强的开源大模型Yi-34B,具备超强的语言理解和处理能力,支持处理40万汉字,在中文指标上表现卓越,标志着中国在大模型领域的重大突破。 项目地址:htt...
-
大型语言模型(LLM)技术精要,不看亏了
哈喽,大家好。 今天分享一篇知乎高赞文章,作者是张俊林老师。 图片 读完收获很多,能帮大家更好地理解、学习大模型。原文有2.8w字,我提炼了核心要点,阅读需要10min。 ChatGPT的出现给很多人带来了惊喜和醒悟。有人惊喜地发现大型语言模型(LLM)...
-
李开复领队开源大模型 Yi,40万字上下文窗口破纪录
由李开复博士亲自下场创办的零一万物(01.ai),自3月底官宣成立后,于近日发布并开源了两个版本的中英文大模型 Yi-6B 和 Yi-34B。 在线上发布环节,李开复博士重点介绍了 Yi 系列大模型的三处性能亮点: 全球最长200K 上下文窗口,免费开...
-
蚂蚁集团CodeFuse代码大模型开源ModelCache大模型语义缓存
蚂蚁集团旗下CodeFuse 代码大模型宣布开源了 ModelCache 大模型语义缓存,可以降低大型模型应用的推理成本,提升用户体验。 ModelCache 的架构包括 adapter、embedding、similarity 和 data_manage...
-
百度网盘首页改版 引入青春感 UI 视觉和大模型智能助理
百度网盘宣布首页改版,新版采用了 “多巴胺” 配色和个性化字体设计,引入了左一屏汇总网盘常用功能组件,并通过 feed 流推荐个人网盘中的 “尘封的记忆”。 据悉,这是百度网盘近4年以来最大的一次首页改版,旨在通过更简单的交互方式、更青春感的 UI 视觉和...
-
马斯克xAI公布大模型详细进展,Grok只训练了2个月
近几日,马斯克的人工智能公司 xAI 公布了他们用来对标 OpenAI ChatGPT 的产品 ——Grok ,直接把网友的好奇心拉满。 和总是一本正经回答问题的 ChatGPT 不同,Grok 自带幽默和嘲讽技能。 就像下图所展示的,Grok 在被...
-
李开复官宣全球最强开源大模型Yi-34B 一次可处理40万汉字
零一万物推出了「Yi」系列开源大模型,其中Yi-34B在全球开源大模型排行榜上取得了显著成就,击败了其他竞品模型,成为双料冠军,尤其在中文指标上表现卓越。Yi-34B的性能超越了全球其他大模型,拥有强大的语言理解和处理能力,可以满足国内市场的需求。 ht...
-
李开复带队创办!零一万物发布首款大模型Yi:号称世界最强
快科技11月6日消息,近日,创新工场董事长兼CEO李开复带队创办的AI大模型创业公司零一万物宣布,正式发布首款研发的最强开源人工智能大模型系列Yi。 此次发布的首个公开版本共包括两款:Yi-6B和Yi-34B,其数据参数量分别为60亿和340亿,...
-
大跌眼镜!GPT-4V错觉挑战实录:该错的没错,不该错的反而错了
GPT-4V挑战视觉错误图,结果令人“大跌眼镜”。 像这种判断“哪边颜色更亮”的题,一个没做对: 读图片中隐藏信息的也傻傻看不出,怎么问都说“没有啊”: 但是呢,这种人类乍一看绝对会错的图,它又成功答对: 以及这样的错位图,它对了又没完全对。。...
-
元象XVERSE开源650亿参数通用大模型XVERSE-65B
元象XVERSE宣布 开源650亿参数高性能通用大模型XVERSE-65B,无条件免费商用。 XVERSE-65B 是由深圳元象科技开发的一种支持多语言的大型语言模型。它采用了 Transformer 网络结构,参数规模达到了650亿。 模型通过训练了2....
-
北大具身智能新成果:无需训练,听指令就能灵活走位
北京大学董豪团队具身导航最新成果来了: 无需额外建图和训练,只需说出导航指令,如: Walk forward across the room and walk through the panty followed by the kitchen. Stan...
-
国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练
国内规模最大的开源大模型来了: 参数650亿、基于2.6-3.2万亿token训练。 排名仅次于“猎鹰”和“羊驼”,性能媲美GPT3.5,现在就能无条件免费商用。 它就是来自深圳元象公司的XVERSE。 根据算力、资源限制和具体任务需求的不同,我们能对...
-
蚂蚁百灵大模型通过备案 多款产品即将向公众开放
蚂蚁百灵大模型已按照国家七部委联合公布的《生成式人工智能服务管理暂行办法》完成备案,基于该大模型的多款产品也已陆续完成内测,即将向公众开放。 蚂蚁百灵语言大模型,它采用Transformer架构,经过万亿级Token语料的训练,支持窗口长度达到32K,并...
-
马斯克版ChatGPT爆火来袭!不用Python,11人爆肝两个月
马斯克突然出手截胡,抢在OpenAI开发者大会前发布大模型Grok。 与其他ChatGPT类产品不同,Grok可以实时从?推文中获取最新知识,比如马斯克刚刚与Joe Rogan的最新访谈。 图片 巨量、实时且独特的?数据构成了Grok的最大护城河,早在7...
-
全球首发!总结七十余种开源数据集,一览自动驾驶开源数据体系
本文经自动驾驶之心公众号授权转载,转载请联系出处。 基于数据驱动的各类深度学习模型任务,近年来随着数据集规模的不断扩大,性能逐渐被提升,国内外各大自动驾驶公司都在不断建立自己的数据库,以及数据闭环系统,期待数据的丰富能够解决下半场自动驾驶问题,那么如何...
-
李开复称其创立的AI公司零一万物估值已超10亿美元 发布大模型Yi-34B
此前,李开复成立了一家初创公司,名为零一万物(01.AI),旨在为中国市场开发本土大型语言模型(LLM)。日前,李开复在接受采访时解释了创建零一万物的动机:“我认为需求是创新之母,在中国显然存在巨大的需求。与世界其他地方不同,中国无法使用OpenAI和Go...
-
王者GPT-4已来,32k上下文!OpenAI首届开发者大会最新爆料,全新UI可定制GPT,xAI大模型大范围可用
OpenAI首届开发者大会开启前,ChatGPT各种爆料已出,全新UI界面,人人可定制GPT,将引领「智能体工程师」新职业诞生。另一边,马斯克自家的xAI大模型也开启了大范围内测。 OpenAI首届开发者大会,开启了倒计时! 还记得周一,OpenAI悄无...
-
中科院物理研究所等发布材料合成AI大语言模型MatChat
近期,中国科学院计算机网络信息中心人工智能部和物理研究所SF10组合作,通过使用来自400多万篇论文中提取的35675个无机材料固相反应合成过程,将数据处理为13878条高可信度的合成路径描述数据,并对开源大语言模型LLaMA2-7B进行微调训练,研发了专...
-
一篇学会大模型浪潮下的时间序列预测
今天跟大家聊一聊大模型在时间序列预测中的应用。随着大模型在NLP领域的发展,越来越多的工作尝试将大模型应用到时间序列预测领域中。这篇文章介绍了大模型应用到时间序列预测的主要方法,并汇总了近期相关的一些工作,帮助大家理解大模型时代时间序列预测的研究方法。...