如何缩小中美通用大模型差距？我在两会看到了答案

“通用大模型关乎国运之争”……

“人工智能+”首次出现在政府工作报告中，并直接上升为一种行动。

雷军刘庆峰等代表委员都将人工智能纳入到自己的建议之中；

又是一年两会进行时，AI大模型受到前所未有的关注。

彼时在大洋彼岸的另一边，GPT-4正被最新大模型全面超越，Sora新视频持续惊艳网友。

一时间，关于国产通用大模型未来发展、中美之间差距还有多少的话题再次引人注目。

既如此且先来看看，两会都聊了啥？或许能从中找到答案。

人工智能火爆两会

与开展“人工智能+”行动相呼应的是，20多位全国人大代表或政协委员都谈到了大模型相关，覆盖到从底层数据算力、模型层以及应用层的方方面面，为当前正面临的挑战建言献策。

通用大模型又成为这其中的关键词。这样的盛况，以往并不多见。

在具体建议中，可以看到大概有三个方面：技术瓶颈、未来发展以及应用落地。

技术瓶颈：数据、算力和产业生态

当前国产大模型技术瓶颈还有哪些？包括科大讯飞董事长刘庆峰、知乎创始人周源、京东集团技术委员会主席曹鹏、中科院计算机所研究员张云泉等在内都发表了自己的看法。

知乎创始人周源谈到了数据方面的挑战，他认为对大模型数据采集进行监督和审查。

京东集团技术委员会主席曹鹏、中科院计算机所研究员张云泉等在内都谈到了突破算力瓶颈，曹鹏鼓励国产算力软硬协同，张云泉提出了集中AI芯片研制、设立智能算力发展专项组等几个方向的建议。

而科大讯飞董事长刘庆峰则从算力、底座平台、源头技术研发等维度介绍了我国发展大模型存在的短板，并建议制定国家《通用人工智能发展规划》，来缩小中美通用人工智能产业的差距，打造我国的比较优势。

未来发展：教育人才和政策法规也成关注焦点

技术之外，教育、人才建设、政策法规等方面也成为了代表们的关注焦点。

小米创始人雷军提出了三项人才相关的建议：从义务教育阶段普及人工智能素养教育；大力推进高校人工智能相关专业的建设；支持大型科技企业和教培机构培育人工智能应用型人才。

还有一些法律界人士，比如金杜律师事务所高级合伙人张毅，提出推进《人工智能法》的出台。

应用落地：如何赋能千行百业？

值得一提的是，此次还有来自影视、体育、农村、养老、制造、文旅等各行业代表也都参与到对于人工智能发展的讨论之中。

比如Sora对影视行业的影响，演员靳东在接受采访时谈到一些服务型的岗位可能会被替代，但短时间内，人工智能很难替代影视等创作行业。

还有像美的副总裁钟铮、拈花湾文旅董事长吴国平、天能控股集团董事长张天任提到了人工智能在制造业、文旅、养老等行业的应用。

……

可以看到的是，大模型毫无疑问地成为此次两会的焦点。在二十多位人大代表或政协委员的提案中，其实也能总结出当前国产大模型的发展缩影：技术挑战仍在，人才政策得跟上，应用发展要加速。

中美差距还有多大？

ChatGPT的出现，国内掀起千模大战，部分玩家的大模型在一年时间实现了对标GPT-3.5的实力，部分能力超过了GPT-4。

而Sora横空出世，仅需通过文本即可自动生成1分钟视频，给视频生成领域带来了颠覆，其展现的性能对同类产品实现了碾压……

于是乎，关于中美之间的差距是否进一步加大再次引发热议。数据、算力、人才培养和投入成为这当中讨论的焦点。

但中美差距具体还有多大？始终没有什么定论。

此次两会上，科大讯飞董事长刘庆峰首次给出了定量描述——

1-2年，追平。

为什么会是这个数字？刘庆峰做了进一步解答。

他认为中美博弈的“主战场”就是在通用底座能力上持续进行对标。而Sora正是基于GPT-4/4V的通用大模型底座能力所延伸出来的特定领域的成功实践。

同样延伸的还有像DALL-E3、Whisper。

他还以讯飞星火大模型为例，预计6个月内可达到GPT4/4V当前最好水平。但随着GPT-5的发布，“这个差距可能会被拉到一年以上”。

因此他也强调称，这也会是一个你追我赶的动态过程。

在刘庆峰这一推论中，在人工智能领域，将通用大模型推至到一个高点，成为中美之间差距的核心竞争点。

也有代表此次在两会上表达了类似的观点：通用大模型的发展，已不是单纯的科技之争，更是国运之争，影响深远。

过去一年可以看到，通用大模型已然成为业内玩家的发展共识。

在模型层，关于长文本处理、多模态、逻辑推理、数学编码等技术突破，以全方位提升通用大模型的理解能力。基础设施层，自主可控算力生态也构建开来，国产算力软硬协同来支撑大模型创新和应用。

当然最明显感知的发展变化，还是应用层的全面开花。

来自医疗、教育、广告营销、制造等各个行业领域的传统玩家，基于通用大模型底座平台以及行业数据，得以让大模型在自身领域加速应用。

千模大战之中，绝大多数也都是行业和垂直领域大模型。而如果没有通用底座大模型的支撑，行业大模型的成效将无法持续进步。

因此，中国必须要有自主可控、对标国际一流水准的通用底座大模型。

这当中最具代表的践行者就是科大讯飞。

过去一年，他们有两个进展值得关注——

一个是中国首个支持万亿浮点参数的国产化算力平台“飞星一号”，联合华为实现国产算力的自主可控。

另一个基于该平台发布讯飞星火V3.5，整体效果逼近GPT-4 Turbo，并初步形成大模型产业生态。

基于算力和持续升级迭代的通用大模型，他们在医疗、教育、工业等场景中有了深度应用，已率先构建出行业领先的大模型产业生态——

截至今年1月，讯飞星火纯用户2400万，基于讯飞听见、讯飞星火APP、讯飞输入法等应用，星火已累计赋能亿万用户。大模型开发者生态积累37万开发者数量，其中企业开发者数量为24万……并从中以此形数据闭环，自驱动大模型的迭代和落地。

过去的发展成绩表明：以科大讯飞为代表的通用人工智能国家队在推动大模型的落地，我们有基础，也有自身的场景和数据优势。但同样也要客观看到差距、正视差距，缩小中美底座大模型的差距。

全球竞争更加激烈，通用底座呼之欲出

2024年刚开年，以天为单位的AI新进展再次让全球无眠。

颠覆视频生成的Sora、全面超越GPT-4的Claude 3、还有Stable Diffusion 3的发布，而在产业链上，英伟达正式突破2万亿美元震惊股市……

显然，全球竞速没有放缓，反而更紧迫了。

但同去年ChatGPT刚出现时百模大战千模大战的各家探索不同，今年国内却显得冷静许多。因为有关技术趋势的共识已经再明显不过：

多模态融合，包括语音、图像、视频等多个模态融合已成为国内外科技大厂大模型升级和迭代重点；
Scaling Law反复被验证，大模型的不同流派走向统一；
软硬件一体，产业链上下游共建的通用底座，更加呼之欲出。也只有通用底座，才是综合实力、长治久安、基业长青、支撑千行百业“AI+”的基石。

有意思的是，这样的洞察，也在两会上也被提及出来了。

刘庆峰给出了全面系统的建议。

他建议在2017年《新一代人工智能发展规划》的基础上，系统性制定国家《通用人工智能发展规划》，以顶层设计来推动通用人工智能的发展。

与此同时，相关工作也要同步展开，为此刘庆峰给出了九点建议。

首先第一点，聚焦通用大模型“主战场”，整合各方资源，持续加大投入。

比如包括以专项的形式在未来5年持续支持研发攻关、支持算力基础设施建设、推动工业和民生等领域的大模型应用等。

随后，就是加强源头技术布局，围绕通用人工智能相关领域，布局战略性、前瞻性基础研究，坚持以源头核心技术突破来推动颠覆式创新的探索。

除了大模型技术外，还要加快脑科学与类脑智能、量子计算以及推动AI for Science的发展。

更为具体的建议还有：

建议加快形成以国产大模型为核心的自主可控产业生态。

建议推动国家级高质量训练数据开放和共享，支持国家战略科技力量以揭榜挂帅形式优先、低成本使用。

建议出台更加客观、公正、可信的评测方法，推动大模型在行业领域应用的健康发展。

除此之外，他还强调了人才培养、法律法规以及伦理人文研究方面的重要性。

尤其是人才培养，他不仅强调了顶尖的创新人才、应用型人才的培养，而且建议加快推广人工智能通识教育，赋能基础教育、职业教育和高等教育全学段，并且建议设立国家人工智能学院。

对于未来可能会被人工智能大量替代的行业和岗位，他认为应该研究新型人才能力素质模型和培养方案。

这样的洞察和建议，之所以系统和全面，一方面是讯飞本身是人工智能国家队，懂行。另一方面，常年的人工智能产业深耕，也让它对产业需求有更深的洞察。

透过此次两会上各位行业代表们的观点，可以看到社会的共识是：

通用大模型是必经之路。

从全球发展来看，实现算力、产业生态的自主可控，才能保证大模型的持续迭代和应用，在全球竞争态势下才能占据一席之地，拥有话语权。

民生社会层面，以大模型为代表的新质生产力，正成为支撑社会发展的新型基础设施。从技术研发到商业落地，这条发展路线上一以贯之的最终目标，都是为各行各业提质提效。

所以即便现在差距仍不可忽视，但包括国产大模型的核心玩家，已经初步探索出了一条自主可控之路，赋能到各行业，这也是大模型的真正价值所在。

从“互联网+”到“人工智能+”，新质生产力机遇，未来可期，中国可期。

大模型人工智能通用大模型 gpt 自主可控 gpt-4 sora 国产大模型讯飞星火创始人开发者基础设施研究员中科院 chat chatgpt 视频生成生产力多模态 gpt-3

如何缩小中美通用大模型差距？ 我在两会看到了答案

人工智能火爆两会

中美差距还有多大？

全球竞争更加激烈，通用底座呼之欲出

如何缩小中美通用大模型差距？我在两会看到了答案