OpenAI宣布了一项新功能,允许第三方开发者对其大规模多模态模型(LMM)GPT-4o进行微调。这一定制选项使开发者能够调整模型的行为,以更好地满足其应用或组织的特定需求。
微调可以改善模型的语调、遵循特定指导方针,并提高技术任务的准确性,即使在数据量有限的情况下,也能取得显著成效。感兴趣的开发者可以访问OpenAI的微调仪表板,选择“创建”,从基础模型下拉菜单中选择gpt-4o-2024-08-06。这一公告是在推出更小、更快的版本GPT-4o mini之后发布的,尽管功能较弱,但同样可以进行微调。
OpenAI的技术人员约翰·阿拉德(John Allard)和斯蒂芬·海德尔(Steven Heidel)在公司博客中表示:“微调可以显著提高模型在各个领域的表现,从编码到创意写作都能得益于此。这仅仅是个开始;我们将继续扩展开发者的模型定制选项。”
免费代币提供至9月23日
OpenAI强调,开发者只需几十个训练样本便可获得显著效果。为庆祝这一新功能,OpenAI将提供每天最多100万的免费代币用于微调GPT-4o,直到2024年9月23日。代币是概念的数值表示,对于模型的输入和输出过程至关重要。开发者必须将其数据转换为代币(令牌化),以有效地微调GPT-4o,并利用OpenAI提供的工具完成此过程。
通常,微调GPT-4o的费用为每百万代币25美元,而运行微调后的模型则需支付每百万输入代币3.75美元和每百万输出代币15美元。使用较小的GPT-4o mini的开发者,每天可获得高达200万的免费训练代币,确保能够广泛接触到微调功能。
OpenAI推出免费代币的举措是为了应对来自谷歌和Anthropic等专有供应商的激烈竞争,以及基于Meta的Llama 3.1的开源模型如Nous Research的Hermes 3。然而,使用OpenAI模型的开发者受益于无需在自己的服务器上托管推理或训练的便利,可以利用OpenAI的基础设施或通过API连接自己的服务器。
成功案例展示微调潜力
GPT-4o微调的推出是在与特定合作伙伴进行广泛测试后进行的,展示了定制模型在各个行业的潜力。例如,人工智能公司Cosine的微调自主AI工程师代理Genie在SWE-bench基准上取得了43.8%的最高成绩,这是迄今为止公开声明的AI模型中最高的。
同样,AI解决方案提供商Distyl在为财富500强企业提供服务时,通过微调GPT-4o在BIRD-SQL基准测试中获得了71.83%的执行准确率,成为顶尖模型,特别是在SQL任务,如查询改写和自我纠正方面表现出色。
优先考虑安全性和数据隐私
OpenAI坚称,在扩展开发者定制选项的同时,安全性和数据隐私是其首要任务。微调后的模型使组织对其数据拥有完全控制权,确保输入和输出不会用于训练其他模型。OpenAI还实施了多项安全措施,包括自动评估和使用监控,以确保遵守其政策。但是研究表明,微调有时可能导致偏离安全协议,并影响整体模型性能。因此,组织必须权衡微调的潜在风险与收益。
随着微调功能的推出,OpenAI强化了其愿景:未来大多数组织将开发适合其行业或特定业务需求的模型。这一新推出的功能标志着向这一目标的重要一步,突显了OpenAI致力于使每个组织都能拥有定制AI模型的承诺。