大模型烧钱战“卷”出白菜价，李开复、王小川为何拒绝入局？

撰稿丨今日晴

出品 | 51CTO技术栈（微信号：blog51cto）

暗流涌动的大模型圈，几乎毫无征兆地开启了价格战。

近一周时间，字节跳动、阿里巴巴、百度、腾讯等多家厂商纷纷调整旗下大模型产品的定价策略，宣布面向企业市场的API价格下调，动辄下调90%以上，更有甚者直接宣布免费。

值得注意的是，在这场硝烟弥漫的肉搏战里，主力多是云巨头，他们所售卖的模型服务往往是与云服务紧密绑定的。而大模型初创公司却顶住了压力，普遍并未有太多动作。零一万物的创始人李开复直接对外表示，疯狂降价是双输；百川智能的创始人王小川也回应：百川不会掺和到价格战当中。

1.字节打响大模型降价第一枪

5月15日，字节跳动豆包大模型率先打响第一枪，宣布主流大模型在企业市场的定价为0.0008元/千Tokens，0.8厘就能处理1500多个汉字，比行业便宜99.3%。这一招彻底推动大模型从“以分计价”进入到了“以厘计价”阶段，并声称已经击穿了大模型行业的最底价，堪称“价格屠夫”。

不过，超低的定价并不代表实际使用的价格。从豆包大模型的官网价格页来看，128k模型的0.0008元/千Tokens定价实际为模型推理服务的输入价格，还需要为模型的输出价格付费0.002元/千tokens。

图片

另外，价格单中展示的价格为“后付费”模式，指企业先消耗tokens，然后为其买单。但对于模型的高并发、稳定性有更高要求的用户，还需要采用“预付费”的模式，获得模型厂商的服务保障，这也会导致实际的使用价格比展示的定价更贵一些。

图片

即便如此，大模型的降价潮已成定势。

有业内人士分析，一些大模型以开源模型为基座，本来成本就低，所以本身还存在降价空间；亦有分析认为，大模型降价主要是为了快速抢占市场，普惠市场才能真正提升使用量，才能更好地打磨出好模型，让生态更完善。

不管实际情况如何，大家心知肚明的一点是，“只要有一家较大的厂商开始降价，其他厂商也会基于压力开始跟随，要不然就可能掉队。”

2.四巨头紧随其后

果不其然。

21日，阿里云发布降价公告，通义千问9款模型齐降价。其中，对标GPT-4的商业化模型Qwen-Long的API输入价格从0.02元/千Tokens降至0.0005元/千Tokens，直降97%；输出价格降至0.002元/千Tokens，比原来定价直降90%。阿里的这一轮操作力度，被视作对市场的又一大冲击。

图片

同样在21日，百度智能云紧随其后，宣布文心大模型两大主力模型ERNIE Speed、ERNIE Lite全面免费，立即生效。据百度有关负责人介绍，这两款模型于今年3月推出，支持128k、8k上下文长度，是目前百度文心大模型系列中服务用户最多的模型型号。

22日，腾讯云也放出杀招，宣布多款混元模型免费或降价。其中混元-lite模型免费，混元-standard-256k输入价格下调87.5%至0.015元/千tokens，输出价格下降50%至0.06元/千tokens。万亿参数模型混元-pro，API输入价格则从0.1元/千tokens降至0.03元/千tokens。与此同时，腾讯云正式对外宣布旗下AI代码助手全面对外开放，目前开发者、开发团队、企业客户可以通过腾讯云官网在线体验。

图片

同在22日，科大讯飞宣布旗下大模型讯飞星火API能力正式免费开放。其中，讯飞星火Lite API永久免费开放，讯飞星火Pro/Max API低至0.21元/万tokens。科大讯飞表示，在讯飞星火，1Token相当于1.5个中文汉字，因此2.1元就足够调用“讯飞星火3.5 Max”生成一部余华《活着》的内容量。

另外放眼国外的话，其实还可以发现，自去年以来，OpenAI已经进行了多次降价，13日，OpenAI发布GPT-4o，表示面向ChatGPT的所有付费和免费用户发布，取消其他所有限制，API价格也降价50%。

3.最便宜的不一定能赢得商战

面对大模型近乎白菜价的甩卖，各方人士对于其直接作用和后续影响有着不同看法。

有人说，价格战实际是大模型产品同质化加剧的恶果，降价成为了争夺市场份额的最直接的获客策略。不过也有人认为，大模型价格战并非盲目以亏损换流量，有技术进步作为控制成本的底气，以此鼓励用户在更多场景探索落地，先把应用场景铺开再谈其他。

火山引擎总裁谭待在接受媒体采访时曾表示，“用亏损换收入是不可持续的，所以豆包大模型从来不走这条路。至于为什么可以这样降价，因为我们有很多手段把成本做得很好。大的使用量，才能打磨出好模型，也能大幅降低模型推理的单位成本。”

百川智能CEO王小川也对“降价战”发表了自己的看法。与移动时代的烧钱不同，王小川认为降价是技术进步的结果。“大厂也预期未来模型的成本会降低特别多，也许今天亏钱，再过一年就不亏钱。我觉得大家对模型降价本身也有推理成本的降低的预期，就是因为技术进步。”

不过，也有人觉得降价策略并不会对商业化造成实质性影响。

Lepton AI 创始人、阿里巴巴原副总裁贾扬清认为，企业在使用AI的时候，并不是成本驱动。不是因为API贵才没人用，而是因为企业首先得搞清楚怎么用来产生业务价值。“也许不是最便宜的赢得商战，而是能落地的赢得利润。”

选择使用大模型产品到底能给其业务带来多少增长，才是企业用户最为关心的。

猎豹移动董事长兼CEO傅盛直言，“这次大降价基本宣告了大模型创业公司必须寻找新的商业模式。短期来看，大模型的性能遇到了瓶颈，谁也甩不开谁，谁也拿不出杀手锏，降低推理成本，降低售价成了现在每一家的高优先级任务。“

他表示，本轮AI大模型降价的目标不是为了用户更多的直接使用，而是为了吸引开发者。这轮降价对企业用户影响有限。因为企业用户需要A1应用，更关心数据安全。现在开源小参数大模型加应用套件，可以满足绝大多数的企业需求了，但套件定制的费用谁也省不掉，私有化大模型的成本已经很低。

4.创业公司的另一种选择：不卷价格，卷性能

巨头们跟进大模型价格战步履匆匆，但大模型创业公司对此态度不一。大模型“五小龙”之中，除了智谱AI已在此前宣布降价以外，其余几家目前尚未对价格进行调整。李开复和王小川均于近日进行了回应，表示不会跟进降价。

这几家创业公司的掌舵人似乎都倾向于：不盲目卷入价格战，而是要坚持在自身的模型性能上发力。

李开复近期在一次访谈中表示，对于降价这个现象值得关注，零一万物也在花很大精力希望能够让它再降下来，并预计整个行业每年降低10倍推理成本是可以期待的。但李开复明确在大模型领域，自己不会玩“ofo”疯狂降价模式的打法，“因为技术还是最重要的，如果是技术不行，就纯粹靠贴钱赔钱去做生意，我们绝对不会跟这样的一个定价来做对标，我们对自己的模型表现是非常自豪的。”

李开复透露，零一万物选择了一条“高精尖”路线，“对要求最高的，需求最高的，需要最好模型的，他们当然用我们。100万个token花十几块还是花几块钱有很大差别吗？”

王小川对于价格战的看法也有其自身的理解。他判断，这一轮大厂降价的实质是云厂商进到新战场，降价不仅是这些大厂射程范围内的事，也是仅限于云厂商的动作。如果是针对企业端服务，这场战争最后也会变成售卖整套云服务而不是模型本身。这很像曾经发生在“AI四小龙”身上的故事。王小川称自己并未因眼前正在发生的争端而产生任何焦虑，但他建议创业公司不要掺和进去。

另一个有趣的现象，与愈演愈烈的降价大潮形成鲜明对比的是，就在前几天，主打免费的月之暗面开始试探让用户付费的可能，一些使用Kimi的重度用户在高峰时段Kimi因为算力不足，弹出一个对话框表示：“急需Kimi？‘点击这里’给Kimi加油，高峰时期优先使用。”

用户在点击链接后会弹出一个新的页面，上面是包含不同价格和对应时长的“打赏方案”，包括5.2元/4天，9.99元/8天，28.8元/23天，49.9元/40天，99元/93天，399元/365天。

这些充值方案对应的打赏话术也比较有趣，相较普通产品更贴近用户生活，强调交互感。它写的是“送Kimi一朵花”、“给Kimi加鸡腿”，以及请喝咖啡、充充电、请吃顿饭和一起登月。除了“登月”，这些场景描述对应的消费与方案价格相匹配。

对话页面下方的《Kimi支付协议》解释道，在高峰时段Kimi算力不足时，产品将在Kimi实际可调用的推理算力范围内，优先保障获得服务用户的推理算力。这个思路有点像B端用户的“预付费”逻辑。

图片

5.写在最后

大模型赛道的战火延绵至今，已经过去一年有余，大模型厂商作为掌握这项魔法的基建提供方，似乎正在来到新的赛点。移动时代的阿里、字节、百度、腾讯等当然熟悉那个年代的商战存活规则，不过大模型时代之下，似乎“烧钱”模式并非适用于今天的生长环境。我们也有理由相信，这波降价背后，离不开推理技术的进步。

此番降价大战，表面上看着实类似当年的疯狂争抢用户规模的打法，但热衷于为企业内部部署大模型的决策者们究竟会因为“API降价甚至免费”而采取更激进的决定吗？

未必，大模型远不止是成本的问题，技术、成本、市场、需求、安全，一个都不能少。而且在大模型赛道上，大厂有大厂的路径，创业公司有创业公司的坚持。或许降低成本是加速验证大模型应用价值的助推器，但归根结底，大模型效果好不好用，能不能带来业务增长才是制胜的关键。

想了解更多AIGC的内容，请访问：

51CTO AI.x社区

https://www.51cto.com/aigc/

大模型 token api 创业公司讯飞星火 cto 创始人企业用户 gpt 模型推理云服务开发者 gpt-4 aigc openai 商业化文心大模型模型性能大模型应用 chatgpt