中国版的chatGPT“文心一言“到底怎样？

GPT4的提前发布，把压力着实给到百度了！在ChatGPT引爆聊天机器人领域后的数月，我们终于迎来了国内的第一款生成式对话产品。

3月16日14:00，百度文心一言新闻发布会于百度北京总部正式召开。百度创始人、董事长兼CEO李彦宏也实现了自己此前的诺言，将酷技术真正变成了一款人人都需要的产品。

据悉，文心一言（英文名：ERNIE Bot）是百度基于文心大模型技术推出的一款生成式对话产品，可实现自然流畅的人机交互。作为百度的核心技术之一，文心大模型ERNIE具备着跨模态、跨语言的深度语义理解与生成能力。而基于ERNIE技术的文心一言，成功将人工智能技术与人类语言交流能力进行了融合，能够为用户提供优质、智能化的交互体验。

1、Robin展示文心一言续写三体、做洛阳纸贵诗、算鸡兔同笼

目前，大型语言模型和生成式AI代表了一个新的技术范式，是全球每家企业都不可错过的机会。百度文心一言定位于人工智能基座模型的赋能平台，将助力金融、能源、媒体、政务等千行百业的智能化变革。

新闻发布会现场，李彦宏展示了文心一言的五大核心能力以及其在五个使用场景的表现，其中包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

在文学创作场景中，文心一言根据对话问答将知名科幻小说《三体》的核心内容进行了总结，并提出了多个续写《三体》的建议和思路。此外，文心一言还根据问题内容准确回答了《三体》作者、《三体》电视剧角色扮演者等事实性信息。

目前生成式AI的主要弊端就是对问题回答的准确性难以保障，而文心一言延续了百度知识增强的大模型理念，大幅提高了事实性问题的准确率。面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题，文心一言也依靠信息检索能力及推理能力得出了正确答案。

在商业文案创作场景中，文心一言则顺利完成了为公司命名、撰写公司Slogan、撰写公司成立新闻稿等创作任务。在连续三次内容创作中，文心一言不仅准确理解了用户意图，还完成了对用户反馈的清晰表达。

这是基于庞大数据规模而发生的“智能涌现”。据介绍，文心一言大模型的训练数据包括万亿级网页数据、数十亿搜索数据及图片数据、百亿级语音日均调用数据，以及5500亿事实的知识图谱等，这使得其在中文语言的理解和处理上，能够优于目前世界范围内几乎所有的其他大模型。数理推算方面，文心一言则依靠其思维能力、数学推演能力及逻辑推理能力成功完成了对“鸡兔同笼”这类锻炼人类逻辑思维的经典例题的解答。

在这一环节中，文心一言不仅识别出了题目中所存在的问题，还成功像人类一样找到了解题思路，并按照正确步骤一步步推演出了题目的准确答案。如果说文学创作、商业文案创作、数理推算是大语言模型常见的优势和能力。那么文心一言的独特之处，则是更优秀的中文理解及多模态生成能力。

作为扎根于中国市场的大语言模型，文心一言具备中文领域最先进的自然语言处理能力，在中文语言和中国文化上有更好的表现。在第四轮演示中，文心一言正确解释了成语“洛阳纸贵”的含义，并结合成语内涵分析出了“洛阳纸贵”对应的经济学理论，甚至还成功用“洛阳纸贵”四个字创作了一首藏头诗。

而在多模态生成方面，李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。有趣的是，文心一言甚至能够生成四川话等方言语音；文心一言的视频生成能力则因成本较高，现阶段还未对所有用户开放，未来会逐步接入。

2、文心一言技术解读

文心一言作为新一代知识增强大语言模型，是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

前三项是此类大语言模型都会采用的技术，ERNIE和PLATO中也已经有应用和积累，在文心一言中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新，也是文心一言未来越来越强大的基础。

文心一言的知识增强主要通过知识内化和知识外用两种方式。知识内化，是从大规模知识和无标注数据中，基于语义单元学习，利用知识构造训练数据，将知识学习到模型参数中。知识外用则是引入外部多源异构知识，进行知识推理、提示构建等等。

文心一言的检索增强，来自以语义理解与语义匹配为核心技术的新一代搜索架构。通过引入搜索结果，能够为大模型提供时效性强、准确率高的参考信息，更好地满足用户需求。

而文心一言的对话增强，则是基于对话技术和应用积累，文心一言具备记忆机制、上下文理解和对话规划能力，实现更好的对话连贯性、合理性和逻辑性。

3、生成式AI催生的三大产业机会

李彦宏提到，如今的AI技术已经发展到一个临界点，各行各业都不可避免地被改变。中国AI市场即将迎来爆发性的需求增长，其商业价值的释放将是前所未有的、指数级的。

自2月份百度官宣“文心一言”以来，已有超过650家企业宣布接入文心一言生态。这意味着很多企业已经理解到，文心一言和生成式AI代表了一个新的技术范式，它会影响到每一家公司。据李彦宏预测，大语言模型将会带来三大产业机会。

第一类便是新型云计算公司，其主流商业模式将从IaaS转变为MaaS。文心一言将根本性改变云计算行业的游戏规则。之前企业选择云厂商更多看算力、存储等基础云服务。未来，则会更注重框架好不好、模型好不好，以及模型、框架、芯片、应用这四层之间的协同。

第二类是进行行业模型精调的公司，这是通用大模型和企业之间的中间层，他们可以基于对行业的洞察，调用通用大模型能力，为行业客户提供解决方案。这方面，百度文心大模型已经在电力、金融、媒体等领域，发布了10多个行业大模型。

第三类则是基于大模型底座进行应用开发的公司，即应用服务提供商。李彦宏断言，对于大部分创业者和企业来说，真正的机会并不是从头开始做ChatGPT和文心一言这样的基础大模型，这很不现实，也不经济。基于通用大语言模型抢先开发重要的应用服务，这可能才是真正的机会。目前，基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司，可能就是未来的新巨头。

文心一言将通过百度智能云对外提供服务，帮助企业构建自己的模型和应用，农业、工业、金融、教育、医疗、交通、能源等重点领域，都会因此效率大幅提升，并在每一个行业快速形成新的产业空间，助力数字中国的实现。李彦宏预告称，百度智能云将于近期举办新闻发布会，主题围绕文心一言的云服务和应用产品，既有公有云服务和也可以做私有化部署。

在发布会末尾，王海峰表示文心一言目前已开放内测。即日起首批用户可以通过邀请测试码在官网体验文心一言产品，百度智能云即将面向企业客户开放文心一言 API 接口调用服务，在官网可申请加入文心一言云服务测试。

4、文心一言，并不完美

Robin 也坦言此次的发布时，文心一言，并没有完全的Ready。

最近一段时间，很多朋友问我，“为什么是今天，你们真的ready了吗”。其实从某种意义上说我们已经为此准备了多年，我们十几年前就开始投入AI研究2019年就推出了文心大语言模型，今天的文心一言是过去多年努力的延续。但也不能说我们完全ready了，文心一言对标ChatGPT、甚至是对标GPT-4，门槛是很高的，全球大厂还没有一个做出来的，百度是第一个。我自己测试感觉还是有很多不完美的地方。个体选择。

5、写在最后

看完这场发布会，相信每个人都有自己不同的感触。归根结底，对用户而言，尤其是在文化内容领域，我们还是更需要国内科技企业实打实地使用海量中文语料训练出一些更加匹配中文环境的本土化高品质大模型。

如今，作为国内AIGC的先行者，百度已在这一领域迈出了第一步。未来百度能否在这条道路上越走越远；是否会有更多优秀的国内科技企业踏足这片土壤；中国的AIGC生态又会在这些先行者的厚积薄发之下，产生哪些变化？让我们拭目以待。