当前位置:AIGC资讯 > AIGC > 正文

百度文心一言用户破 2 亿,李彦宏:文心大模型已成中国最领先的 AI 基础模型

过去,开发者用代码来改变世界,未来,自然语言将成为通用的编程语言。

用代码书写历史的程序员会被 AI 取代吗?一个全知全能的大模型能适配一切吗?大模型成本过高怎么办?在这个 AI 时代,什么样的工具才能被称为最好用的工具?

这些问题,并非空中楼阁,而是每一个身处技术浪潮中我们所关心的现实问题。

幸运的是,在今天举行的 2024 百度 Create AI 开发者大会上,李彦宏的主题演讲也许能够帮助我们找到答案,或者至少是通往答案的线索。

在不久的将来,通过 AI 的力量,我们可以打破传统的编程壁垒,让每个人都能够通过自然语言与计算机进行交流,就像与另一个人交谈一样自然和直观。

只要会说话,就可以成为一名开发者

以后不会存在程序员这种职业了,只要会说话,人人都会具备程序员的能力。

上个月,在接受央视《对话》的采访时,李彦宏笃定地如上说道。今天,李彦宏也再次重申了这一点,未来开发应用甚至就像拍短视频一样简单,人人都是开发者,人人都是创作者。

在过去一年的实践中,百度踩了无数的坑,交了高昂的学费,但正是这些经历,让百度找到了属于自己的 PMF,也奠定了未来的发展方向。

在李彦宏看来,百度的角色定位就是尽可能为大家提供必要的开发工具,不断地提升整个社会的创造力。为此,百度不仅推出了强大的基础模型——文心大模型系列,还开发了基于大模型的应用定制工具。

自去年 3 月 16 日文心一言上线以来,经过一年零一个月的发展,它的用户数量突破了 2 亿大关,每天 API 的调用量达到了惊人的 2 亿次,服务客户数达到了 8.5 万,通过千帆平台开发的 AI 原生应用数量更是超过了 19 万。

从 3.0 版本到 3.5 版本,再到现在 4.0 版本,智能化水平不断提升的文心一言正在逐步走进千家万户,改变着人们的工作和生活。

在广告行业,从业人员可以利用它整理资料大纲,将原本需要沟通 5 到 6 轮的提案过程缩短到了 3 轮以内,大大节省了宝贵的时间。同时,它还能快速润色创作内容,激发出更多的创意和想法。

设计师们也通过使用文心一言的 AI 绘画功能寻找灵感,让不同年龄段的爱好者跨越年龄界限,共同创作出更好的作品。

基于文心大模型的智能代码助手 Comate,不仅支持 100 多种语言和所有的 IDE(集成开发环境)平台,还可以深度解读代码库、关联私域知识生成新的代码。

上线一年多,Comate 生成代码的采纳率达到 46%;在百度每天新增的代码中,已有 27% 是由 Comate 自动生成的。

在发布会现场,李彦宏还正式官宣推出文心大模型 4.0 的工具版。

现在,用户可以在工具板上体验代码解释器的功能,通过自然语言交互就能够实现对复杂的数据和文件的处理和分析。

它甚至能够生成图表和文件,帮助用户洞察数据的特点,分析变化趋势,为后续的决策提供高效和精准的支持。

李彦宏在发布会上表示,文心大模型已经成为了中国最领先、应用最广泛的 AI 基础模型。与一年前相比,文心大模型的算法训练效率提升了 5.1 倍,周均训练有效时间达到了 98.8%,推理成本更是降至原来的 1%。

李彦宏手把手教你用三大 AI 开发者神器

大语言模型本身并不直接创造价值,基于大模型开发出来的一些应用,才能满足真正的市场需求。

李彦宏在发布会提出了 AI 领域未来发展的三大判断。

首先,未来大型的 AI 原生应用,基本上都是 MoE 架构,大小模型的混合使用,能够在保证效率的同时兼顾成本,实现最优的应用性能。

其次,小模型具有成本低,响应速度快的优势,在特定的应用场景中,经过蒸馏精调后的小模型,其性能甚至可以媲美大模型,这一点,早在 Mistral AI 的模型上就已经得到充分的证明。

然后,智能体能力的提升会催生出来大量 AI 的原始性应用,使得机器能够像人一样可以进行思考和行动。

对此,百度精心推出了三款开箱即用的 AI 开发者神器,分别是智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder、以及更专业,支持各种尺寸模型定制的开发工具 ModelBuilder。

Agent Builder 的核心理念是零门槛。即便是不懂编程的代码小白,也可以利用文心智能体平台的零代码模式,通过简单的自然语言交互,创建出属于自己的智能体。

例如,我们可以创建一个新加坡旅游局的智能体,然后再利用自然语言设定提示词,设定它的功能范围,使其成为一个贴心的旅游搭子。

得益于携程等旅游服务的接入,Agent Builder 开发的智能体能够为用户提供更加全面和便捷的旅游服务。无论是酒店预订、景点推荐还是票务服务,都能通过智能体得到有效的整合和提升。

更重要的是,百度搜索、贴吧、小度、地图等产品都具备接入智能体的能力。比如在百度搜索新加坡旅游方案,它甚至能直接汇总几个链接的内容,为用户提供精确的答案。

这种智能体的集成,不仅提升了用户体验,也为开发者解决了流量分发的问题,帮助他们获得实质性的收益。随着智能体的不断迭代和优化,它们的功能将越来越强大,越来越聪明。

号称目前最好用的 AI 原生应用开发工具 AppBuilder 则是百度推出的第二款 AI 开发者神器。

百度提前封装和预制了开发 AI 原生应用所需要的各种组件和框架,大幅度的降低了开发门槛。用李彦宏的话来说,最快只需要三步,开发者就可以用自然语言开发出一个 AI 原生应用。

今年年初,百度举办了一期 AI 原生应用的开发挑战赛。赛题就是打造一款游乐场的排队规划助手,帮助用户设计出个性化的游玩路线。最终夺冠的选手连一行代码都不用写,成功开发出了相应的应用。

华北电力大学则是在智能体的基础能力之上,结合 AI 优化配置的功能,打造了一个华电 AI 助理。这款助理能够轻松应对校园生活中的各种高频场景,如查询校园制度、浏览课程表、充值饭卡、借阅图书等。

百度文库则在多模态技术的深厚积累下,通过 AI 重构,成为了内容创作的新起点。其最新推出的智能漫画和画本的生成工具,让每个有创意的人都能轻松做出好作品。

以传统的周处除三害故事为例,用户只需在百度文库中搜索相关主题,工具便能根据原文故事情节自动生成分镜,并绘制出满足用户需求的漫画,让传统故事焕发出新的生命力。

睡前故事听腻了,父母也能利用百度文库的 AI 画本功能,为孩子创作一个专属的儿童画本,让阅读成为一种全新的亲子互动体验。

对于开发者而言,掌握大模型的精调方法至关重要。百度推出的 ModelBuilder 工具,正是为了满足专业开发者的这一需求。

ModelBuilder 能够根据开发者的具体需求,定制任意规模的模型,并对模型进行细分场景的深度精调,以实现最佳的性能表现。

ModelBuilder 集成了包括文心大模型系列在内的 77 款精选大模型,并提供了全流程的模型工具链。同时,它还提供丰富的 SDK 和全栈 API 能力,能够完成一站式的模型精调。

此外,ModelBuilder 还提供了模型精调样板间,在 ModelBuilder 官网即可查看高频场景样板间,开发者只需要跟着样板间一步一步精调,就能做出一模一样的专业模型。

正如上文所提到,大型的 AI 原生应用,一般都是 MoE 架构。那么如何组合使用这些模型才能获得最好的性价比呢?

为了更直观展示这一概念,李彦宏用大模型加持的小度给我们展示了一番。

无论是实时搜索信息、播放新闻,还是处理复杂的行程规划,小度都能通过调用不同的模型来高效完成。

值得一提的是,在本次发布会上,小度科技也宣布推出了「全球首个 AI 原生操作系统」——DuerOS X。

该操作系统依托于百度文心大模型,并在此基础上进行了深度优化,使得其在多模态感知与人性化表现方面取得了「显著进展」,能够实现小度设备全天候免唤醒的语音交互功能,号称实现「唤醒识别率高达 99% 以上,理解并满足用户需求的能力超过 95%」。

多模态被广泛认为是迈向 AGI 的必由之路。基于这样的理念,百度利用超过 1 亿公里的中国复杂的城市道路的测试里程数据,成功训练出了 Apollo 视觉感知大模型。

随着全球最大规模、覆盖 360 万公里道路的车道级地图数据的上线,百度地图导航能去的地方,智驾也能到达。

正如李彦宏所言,今天的中国有 10 亿互联网用户,有强大的基础大模型,有足够多的 AI 应用场景,有全球最完备的产业体系,为中国的 AI 发展提供了坚实的基础和无限的可能性。

在这样的大背景下,比起一窝蜂地跟随底层大模型的热潮,不追求短期的喧嚣和热闹,找到更契合实际的应用场景,让 AI 技术真正落地无疑是一种更为明智和务实的策略。

从文心大模型的发展思路,到为开发者量身打造的三大 AI 神器,我们看到了百度对技术创新和开发者需求的深刻洞察。这次的主题演讲,不仅展示了百度的技术实力,也向我们揭示了百度未来 AI 发展的明确方向。

在 AI 的浪潮中,百度正以稳健的步伐,全力寻找属于自己的节奏和方向。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

大模型 AI 能干什么? 大模型是怎样获得「智能」的? 用好 AI 的核心心法 大模型应用业务架构 大模型应用技术架构 代码示例:向 GPT-3.5 灌入新知识 提示工程的意义和核心思想 Prompt 典型构成 指令调优方法论 思维链和思维树 Prompt 攻击和防范 …

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

为什么要做 RAG 搭建一个简单的 ChatPDF 检索的基础概念 什么是向量表示(Embeddings) 向量数据库与向量检索 基于向量检索的 RAG 搭建 RAG 系统的扩展知识 混合检索与 RAG-Fusion 简介 向量模型本地部署 …

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

为什么要做 RAG 什么是模型 什么是模型训练 求解器 & 损失函数简介 小实验2:手写一个简单的神经网络并训练它 什么是训练/预训练/微调/轻量化微调 Transformer结构简介 轻量化微调 实验数据集的构建 …

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

硬件选型 带你了解全球大模型 使用国产大模型服务 搭建 OpenAI 代理 热身:基于阿里云 PAI 部署 Stable Diffusion 在本地计算机运行大模型 大模型的私有化部署 基于 vLLM 部署大模型 案例:如何优雅地在阿里云私有部署开源大模型 部署一套开源 LLM 项目 内容安全 互联网信息服务算法备案 …

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

123?spm=1001.2014.3001.5501)这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

更新时间 2024-05-28