每天免费100万token，GPT-4o新增微调功能

OpenAI向所有开发者推出GPT-4o数据微调功能，可以使用自己的数据打造准确率、输出模式更好的个性化ChatGPT助手。

例如，韩国最大电信运营商SK Telecom通过OpenAI的数据微调功能，打造了特定的AI助手，使对话总结准确率提高了35%，意图识别率提升了33%，客户满意度大幅度提升。

同时OpenAI宣布从今天到9月23日，每天免费提供100万token微调额度，推理成本每100万token输入3.75美元，每100万token输出15美元。

什么是数据微调

通常大模型是在超大规模数据上进行预训练的，以学习通用的语言知识和输出模式。由于数据过于杂乱，模型可能在金融、法律、医疗等业务中的表现并不理想，因为没有针对特定领域进行专门优化。

而数据微调可以将与特定任务或领域相关的新数据融合到模型中，并使用这些数据来调整模型的参数，使模型能够更好地理解和处理这些特定的数据。

在微调过程中，将收集到的特定任务数据输入到预训练模型中，然后通过反向传播、梯度下降、监督学习等技术，调整模型的参数使其在特定任务上的表现优化，模型会逐步学会识别和处理特定任务的数据模式。

例如，GPT-4o模型只能生成一般性的宽泛文本，但我们想要将其应用于情感分析领域，以判断文本的情感倾向是积极、消极还是中性。

我们就可以收集大量带有情感标注的文本数据，并使用这些数据对模型进行微调。在微调过程中，模型可以更好地学习如何根据文本中的词汇、语法和语义信息来判断情感倾向。

实际微调案例

Genie是上周 AI Agent代码领域杀出的一匹大黑马，其性能超过了同类的Devin、Amazon Q、Swe-agent+GPT-4等，而该产品便是基于Genie自有数据在GPT-4o上微调而成。

Genie能够实现跨复杂平台端到端的进行推理，能够像人类那样来修改和检测代码。在GPT-4o的帮助下，Genie 在OpenAI新发布的SWE-bench Verified 基准测试中实现了43.8% SOTA得分。还在 SWE-bench Full 基准测试中取得了30.08% 的得分，也是目前最高的评分。

Harvey是一家专门为律师提供类ChatGPT助手的服务商，为了更好的提升法律内容输出与准确率，使用了OpenAI的GPT-4进行数据微调。

在微调的过程中，他们使用了10亿token的数据，并对模型训练过程的每一步都进行了修改。最终，该AI助手的回答准确率提升了83%，使得律师们更喜欢这种微调的助手。

Distyl是一家为财富500强企业提供 AI 解决方案的合作伙伴，最近在 BIRD-SQL 基准测试中获得了第一名，这是领先的文本到 SQL 基准测试。

Distyl的微调 GPT-4o 模型在排行榜上实现了71.83% 的执行准确率，并在查询重构、意图分类、思维链和自我纠正等任务中表现出色，尤其是在 SQL 生成方面表现尤为突出。

总结

**OpenAI推出GPT-4o数据微调功能，助力开发者打造个性化ChatGPT助手**
OpenAI近日向全球开发者宣布了一项重大更新——GPT-4o数据微调功能的全面开放。这一创新功能允许用户利用自有数据，对GPT-4o模型进行深度定制，显著提升个性化ChatGPT助手的准确率和输出质量。
**实际成效显著，行业应用广泛**
以韩国最大电信运营商SK Telecom为例，通过利用OpenAI的数据微调技术，该公司成功打造了针对特定业务场景的AI助手。该助手在对话总结准确率上提升了35%，意图识别率更是高达33%的增长，直接推动了客户满意度的显著提升。
**限时免费额度，降低微调成本**
为了鼓励更多开发者尝试并受益于这一功能，OpenAI宣布从今天起至9月23日，每天免费提供100万token的微调额度。同时，官方还公布了透明的费用标准：每100万token的推理成本为3.75美元，而每100万token的输出费用则为15美元，让数据微调更加经济实惠。
**深入解析数据微调**
数据微调作为一种高效的技术手段，其核心在于将特定领域或任务的新数据融入预训练模型中，通过反向传播、梯度下降等先进技术，精细调整模型参数，以实现针对特定场景的优化。这一过程使得模型能够更好地理解和处理特定数据，从而在诸如金融、法律、医疗等专业领域展现出更为卓越的性能。
**成功案例纷呈，展现微调魅力**
在实际应用中，数据微调技术已经取得了众多令人瞩目的成果。以AI Agent领域的黑马Genie为例，该产品通过基于自有数据在GPT-4o上的微调，实现了跨复杂平台的高效推理能力，并在OpenAI发布的SWE-bench Verified基准测试中取得了43.8%的SOTA得分，同时在Full基准测试中更是获得了30.08%的最高评分。
此外，专为律师服务的Harvey和为企业提供AI解决方案的Distyl，也分别通过数据微调技术，显著提升了各自AI助手的性能和表现。Harvey的AI助手在回答准确率上实现了83%的大幅提升，而Distyl的微调GPT-4o模型则在BIRD-SQL基准测试中勇夺桂冠，展现出了卓越的执行能力和广泛的任务适应性。
综上所述，OpenAI推出的GPT-4o数据微调功能无疑为开发者提供了一个强大的工具，帮助他们轻松打造个性化、高效能的ChatGPT助手。随着更多行业案例的成功展示，这一技术有望在未来迎来更加广泛的应用和发展。