内测挤爆的文心一言，能否迎战GPT-4？

2月7日，百度宣布推出ChatGPT类型人工智能产品“文心一言”，并于3月份完成内测向公众开放。一个多月后的今日，在北京百度总部和上海张江人工智能岛，文心一言如期而至。

百度董事长兼CEO李彦宏介绍，文心一言在商业文案创作、数理推算等方面有突出能力，同时他也承认，文心一言“并没有完全ready（准备好）”。

背负着国内市场的期待，文心一言为何要匆忙上线？业内人士认为，国内GPT技术的发展，要以抢占应用场景为先机，再辅助以算法技术的迭代，“边学边赶”才能有机会与国际AI巨头迎头赶上。

具备更强中文理解力

发布会现场，李彦宏展示了文心一言在五个使用场景的表现，包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

在文学创作场景中，文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结，并提出了五个续写《三体》的建议角度，体现出对话问答、总结分析、内容创作生成的综合能力。此外，文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。据介绍，AICG内容回答事实性问题时容易出现事实性差错，而文心一言延续了百度知识增强的大模型理念，大幅度提升了事实性问题的准确率。

在商业文案创作场景中，文心一言也完成了给公司起名、写口号和新闻稿的创作任务。

“AI要写好一篇稿子，除了需要准确理解我们的意图，还要有清晰的表达能力。”李彦宏解释称，人类常说“读万卷书”，AI则是 “读书破千亿卷”。文心一言大模型的训练数据包括万亿级网页、数十亿的搜索数据和图片、百亿级的语音日均调用数据以及5500亿条事实的知识图谱等。“有研究表明，数据规模足够大，参数达到千亿级，大模型就可能发生‘智能涌现’，即使在没有专门训练过的领域，也能涌现出知识理解和逻辑推理能力。”

文心一言还具备了一定的思维能力，能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题，文心一言能理解题意，并有正确的解题思路，进而像学生做题一样，按正确的步骤，一步步算出正确答案。

值得一提的是，文心一言扎根于中国市场的大语言模型，因而具备中文领域先进的自然语言处理能力，在中文语言和中国文化上有更好的表现。在现场展示中，文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论，还用“洛阳纸贵”四个字创作了一首藏头诗。

除了日常的对话，李彦宏现场还展示了文心一言生成文本、图片、音频和视频的能力，还能够生成四川话等方言语音。不过遗憾的是，视频生成能力因成本较高，现阶段还未对所有用户开放。

“多模态是生成式AI一个明确的发展趋势。”李彦宏表示，“未来，随着百度多模态统一大模型的能力增强，文心一言的多模态生成能力也会不断提升。”

常用功能表现正常，漏洞仍然不少

“十月怀胎，一朝分娩。”李彦宏在发布会上如是形容文心一言的诞生。

据悉，文心一言的上线已连续多日进行压力测试，亚洲目前最大的单体智算中心山西阳泉百度智算中心，已经将算力提升到每秒可以完成400亿亿次浮点运算，并与全国其他几座智算中心共同为文心一言提供算力支持。

除了日常对话外，文心一言还提供了写报告、AI作画和查知识点三个功能模板。

文心一言在“传统媒体融合转型”为题的报告中，不仅解释了“媒体融合”的意义，还给出了数字化转型、内容创新、用户分析等多方面建议。懂经哥发现这些内容并非是搜索引擎的直接呈现，而是经过大模型的整理和归纳。在查知识点和AI作画方面，文心一言也正常表现，通常在一分钟内能够给出反馈。

不过，懂经哥在试用时发现，文心一言在交流方面仍有不少漏洞，时常出现前后矛盾的现象。另外，在对话过程中缺少上下文之间的呼应，更像是一对一的应答。

也有部分内测用户表示，同样的问题抛给文心一言和GPT-4，两者的答案有一定差距。比如《三体》的续写，“文心一言”的答案比较抽象，比如生命的意义、人类的宇宙关系，而GPT-4的回答更具体、更有冲突感，比如类人机器人的崛起、黑暗森林法则的挑战等。

试用申请挤爆测试网页

本月15日，OpenAI推出了GPT-4，市场反馈优于ChatGPT，文心一言今日上线，难免与GPT-4将有所比较。

百度早在2019年推出了文心大语言模型，以此为基础的文心一言也属于百度多年来的“厚积薄发”，不过就连李彦宏自己也承认：“不能说我们完全ready了，文心一言对标ChatGPT，甚至是对标GPT-4，门槛仍然是很高的，我自己测试感觉还是有很多不完美的地方。”

或许是担心文心一言的稳定性，李彦宏在发布会现场并未使用现场实时演示，而是采用提前录制好的视频进行了文心一言的能力展示。李彦宏也表示，该模型目前还存在一定不足，“无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理，需要多年的坚持和积累，没法速成。”

资本市场对文心一言的反应也不尽理想。今日午后，百度的港股出现持续下挫，跌幅一度达到近10%，随后略有收窄。截至收盘，百度股价报收125.1港元/股，跌6.36%，总市值3458亿港元。

文心一言为何仓促上线？百度今日披露的两组数据能说明问题——短短一个月的时间，超过650家合作伙伴宣布加入文心一言生态；发布会后一小时内，排队申请文心一言企业版API调用服务测试的企业用户已达3万多家，申请产品测试网页多次被挤爆，百度智能云官网流量飙升百倍。

“大家都希望能早一点用上最新最先进的大语言模型。”难怪李彦宏直言，“文心一言”并不完美，但市场有需求必须要推出来。

对于“用市场换时间”的做法，360创始人周鸿祎也公开表示认同。“目前国内发展GPT技术，首先要占据应用场景，同步全力发展核心算法技术。”他表示GPT技术的应用场景需要复杂的工程化和商业化的能力，以及丰富的数据清洗和人工标注的经验，如果等国内的算法赶上GPT-4再上马，市场就错过了。

GPT概念是风口还是泡沫？

除了文心一言外，国内已有多家机构和企业推出类GPT大模型。今年2月，小冰公司的ChatGPT应用“小冰链（X-Chain of Thought & Action）”开启了小范围内测。3月初，复旦大学计算机科学技术学院邱锡鹏团队发布类ChatGPT模型MOSS，目标是打造一个具有中国特色的中文大型语言模型；360也表示将借鉴微软与OpenAI能力结合所推出的New Bing模式，推出新一代智能搜索引擎，并基于搜索场景推出人工智能个人助理类产品。阿里达摩院类ChatGPT产品已处于内测阶段，京东云将推出产业版ChatGPT—ChatJD……更多大模型也在逐步内测推进中。

据国际数据公司（IDC）测算，2021年全球市场人工智能市场收入规模达850亿美元，并将于2025年突破2000亿美元大关，复合年均增长率高达24.5%。另据中信建投报告显示，中国人工智能行业发展势头凶猛，在全球人工智能产业化地区中仅次于美国和欧盟，约占全球市场规模的9.6%，2022年中国人工智能市场规模达2729亿元。

GPT概念到底是风口还是泡沫？国研新经济研究院创始院长朱克力告诉懂经哥：“如百度等技术型公司已在大模型领域深耕多年，AI技术较为成熟，文心一言的出现无疑是利好，抓住这一机会能优先抢占市场。”他也劝告投资者切勿盲目跟风，一些企业缺少技术优势，仅以ChatGPT为噱头赢得股市青睐，一旦泡沫戳破将损失惨重。”

“AI市场爆发性的需求增长，将释放出前所未有的、指数级的商业价值。”李彦宏预测，大语言模型将带来云计算、模型精调和应用服务提供商三大产业机会，“基于文本生成、图像生成、音频生成、视频生成、数字人、3D等场景，已经涌现出很多创业明星公司，可能就是未来的新巨头。”

国信证券研报也认为，AIGC应用场景有望全面爆发，作为生产力工具还将不断推动聊天机器人、数字人、元宇宙等领域发展。作为推动人工智能发展的三大要素，算法目前仍在迭代，数据积累量不够，算力也刚刚突破，“三兄弟”的突破还将不断创造出新的业态和应用。