GPT-4o mini实力霸榜，限时2个月微调不花钱，每天200万训练token免费薅

Llama3.1405B巨兽开源的同时，OpenAI又抢了一波风头。从现在起，每天200万训练token免费微调模型，截止到9月23日。

Llama3.1开源的同一天，OpenAI也open了一回。

收到邮件的开发者们激动地奔走相告，这么大的羊毛一定要赶快薅。

另一边，GPT-4o mini在大模型竞技场LMSYS排名也出来了。

总榜单中，GPT-4o mini与GPT-4o并列第一。

Altman本尊激动地表示，我从未对任何一次评估如此兴奋过，GPT-4o mini与GPT-4o性能如此接近，而价格仅有其1/20!

同时，他表示，GPT-4o mini的微调现在上线了。

OpenAI能把如此强大的模型，放出来让大家免费用，实在是出人意料。

网友一度以为，这可能是最高级的钓鱼邮件。

每天200万token，GPT-4o mini免费微调

邮件中，OpenAI宣布现正式推出GPT-4o mini微调功能，为的是让最新小模型在特定用例上，表现更加出色。

7月23日-9月23日期间，开发者们每天可以免费使用200万训练token。

超过的部分，将会按3美元百万token收费。

到了2个月免费使用截止后，微调训练也将按照3美元百万token收费。

此外，OpenAI在邮件中给出了，每个人值得从GPT-3.5Turbo切换到GPT-4o mini的原因:

- 更实惠:GPT-4o mini的输入Token费用比GPT-3.5Turbo低90%，输出Tokens费用低80%。即使在免费期结束后，GPT-4o mini的训练成本也比GPT-3.5Turbo低一半。

- 更长的上下文:GPT-4o mini的训练上下文长度为65k Token，是GPT-3.5Turbo的4倍，推理上下文长度为128k Token，是GPT-3.5Turbo的8倍。

- 更聪明且更有能力:GPT-4o mini比GPT-3.5Turbo更聪明，并且支持视觉功能（尽管目前微调仅限于文本）。

最后，邮件中还提到，GPT-4o mini微调功能将向企业客户，以及Tier4和Tier5开发者开放，未来将逐渐扩大访问权限，扩展至所有级别的用户。

想要动手操作的小伙伴们，OpenAI已经放出了微调指南，可参见:

https://platform.openai.com/docs/guides/fine-tuning/fine-tuning-examples

一部分网友对此并不看好，他们正在保存我们的数据，来训练和改进AI模型。

「又名，把你的私人数据给我，我会收你很少的钱」。

网友用例

拿到资格的网友，已经迫不及待上手测试了。

开发者使用《经济学人》风格的头条数据集，对gpt-4o mini进行了微调。

然后，他比较了gpt-4o、gpt-4o min原始模型和微调后的模型在生成头条方面的表现。

小模型霸榜，堪比GPT-4o

GPT-4o mini发布一周后，在大模型排行榜中的成绩终于出来了。

共收到了4K+用户投票，GPT-4o mini小模型直接攀升至榜首，与GPT-4o并列第一。

最最重要的是，便宜20倍!

这对于众多开发者来说，是个好消息，能够以更低的成本，搭建更强大的应用。

在数学细分领域中，GPT-4o mini的性能有所下降，排在第9。

此外，在hard prompt评测中，GPT-4o mini依旧保持了稳健的性能，实力仅次于GPT-4o、Claude3.5Sonnet。

在编码领域，GPT-4o mini同样展现出强大的能力。

关于GPT-4o mini在Arena中排名如此高的原因，很多人提出了疑问。

官方对此解释是:

- Chatbot Arena根据不同领域的人类偏好进行评估。鼓励大家不仅关注总排行榜，还要查看各个类别的排名（如数学、编码等）。

- Arena评估是实时进行的。鼓励大家在Arena中亲自对比模型，实时验证自己的假设。

- 透明性是我们的核心价值;所有代码和分析都是开源的（https://github.com/lm-sys/FastChat）。我们定期发布20%的数据，保留其余数据以避免过拟合，维护基准测试的完整性。

- 我们将根据政策发布随机的20% GPT-4o mini对战数据，大家可以亲自查看答案。

不过，另有网友认为，gpt-4o-mini的胜利是一个实质性的证据，证明了普通人并不那么聪明。

而且，这是历史上首次，AI变得足够聪明可以愚弄我们。有点疯狂，也有点具有历史意义。

参考资料:

https://x.com/moyix/status/1815840634013639086

https://x.com/HamelHusain/status/1815848198927434019

https://x.com/sama/status/1815877987696533897

https://x.com/0xSMW/status/1815869241205350641

总结

### 文章总结：
近日，科技界发生了几项重大事件：Llama3.1405B巨兽模型的开源与OpenAI宣布的重大免费服务吸引了众多开发者的关注。
1. **Llama3.1405B与OpenAI的双重开源举措**：
- **Llama3.1405B开源**：Llama3.1405B巨兽模型的开源引发了广泛关注，但与此同时，OpenAI也不甘示弱，宣布了一项令人瞩目的免费活动。
- **OpenAI的免费微调计划**：OpenAI宣布，从即日起至9月23日，每天为开发者提供200万训练token的免费微调服务，以协助他们优化GPT-4o mini模型的性能。这不仅让开发者们兴奋不已，还引发了关于“薅羊毛”的热烈讨论。
2. **GPT-4o mini的崛起**：
- **与GPT-4o并驾齐驱**：在大型模型竞技场LMSYS的排名中，GPT-4o mini与GPT-4o并列第一，且其价格仅为GPT-4o的1/20，这一成绩令人瞩目。
- **性能与成本优势**：GPT-4o mini在性能上与GPT-4o接近，但成本更低，训练tokens费用低90%，输出tokens费用低80%。同时，它拥有更长的上下文处理能力，使任务处理更加高效。
- **免费微调策略**：为了进一步推广和测试GPT-4o mini，OpenAI在两个月内提供免费微调服务，超过部分将按每百万token 3美元的标准收费。这项免费政策旨在让更多人体验并优化GPT-4o mini的性能。
3. **开发者与网友的反应**：
- **开发者测试与反馈**：部分获得测试权限的开发者已经开始对GPT-4o mini进行微调测试，并取得了令人满意的结果。
- **网络热议**：虽然OpenAI的免费政策受到欢迎，但也有网友担忧数据隐私问题，认为OpenAI可能利用这些数据进行模型训练。不过，GPT-4o mini在性能上的优势让这些质疑声逐渐淡化。
4. **GPT-4o mini在各个领域的表现**：
- **总体与细分领域的表现**：GPT-4o mini在总体排名中表现出色，与GPT-4o并列第一。虽然在数学细分领域排名第九，但在编码和其他领域展现出强大的能力。此外，它在hard prompt评测中的表现也相当稳健。
- **官方解释与透明性**：对于GPT-4o mini在竞技场中的出色表现，OpenAI官方强调了评价的实时性和透明度，并承诺将发布对战数据供用户验证。
5. **历史意义与未来展望**：
- **历史性的胜利**：有网友认为GPT-4o mini的胜利标志着AI技术已经足够成熟，可以愚弄人类，这是具有历史意义的。
- **未来发展趋势**：OpenAI表示将逐步向更多用户开放GPT-4o mini微调功能，预示着更多开发者和个人将有机会利用这一强大的模型进行创作和创新。
通过这些事件可以看出，人工智能技术的发展正在以前所未有的速度推进，各种开源模型和优化政策的出台不仅促进了技术的创新与交流，也为未来的人工智能应用场景提供了无限可能。