OpenAI推出了最新的小型生成模型——GPT-4o mini,这款模型比标准的GPT-4o更具资源效率和成本效益。这项升级使开发者能够更轻松地将人工智能技术整合到更多产品中,同时也改善了ChatGPT的免费版本,降低了用户的使用限制。
目前,GPT-4o mini可通过ChatGPT网页和应用程序在免费、Plus和团队套餐中使用,而ChatGPT企业订阅用户将在下周获得该功能。从今天开始,GPT-4o mini将取代现有的小型模型GPT-3.5 Turbo供最终用户使用。虽然老型号仍可通过API供开发者使用,以便那些希望暂缓迁移到GPT-4o mini的用户使用,但OpenAI计划在未来逐步淘汰这个旧模型,具体时间尚未确定。
自5月以来,GPT-4o已向免费ChatGPT账户开放,但因需求高峰而有一定限制。更新后的常见问题解答已明确表示,尽管GPT-4o仍面临限制,用户在达到使用限制时将自动切换到GPT-4o mini,而不是GPT-3.5。这一变化将惠及尚未升级到ChatGPT Plus的用户。
随着GPT-4o mini的推出,OpenAI旨在提高所有用户的人工智能可及性,现已在API中提供,并正在ChatGPT中推广。根据人工智能分析的数据,新模型在MMLU推理基准测试中获得了令人印象深刻的82%,比Gemini 1.5 Flash高出3%,比Claude 3 Haiku高出7%。目前,MMLU基准赛事的纪录由谷歌的领军AI——Gemini Ultra以90%得分保持。
值得注意的是,OpenAI报告称,GPT-4o mini的运营成本比GPT-3.5 Turbo低60%。开发者的费用为每百万个输入令牌15美分,每百万个输出令牌60美分。根据CNBC的报道,OpenAI将GPT-4o mini誉为“当前最强大且最具成本效益的小型模型”。成本节省的原因在于,很多提升了的AI任务并不需要大型模型(如GPT、Claude或Gemini)的全部功能。对于简单且高容量的任务,使用大型语言模型(LLM)通常会导致不必要的高成本和资源消耗。这也是小型LLM(如谷歌的Gemini 1.5 Flash、Meta的Llama 3 8b或Anthropic的Claude 3 Haiku)具有优势的原因,因为它们能更快、更经济地完成这些任务。
OpenAI还表示,GPT-4o mini保持与全尺寸模型相同的上下文窗口大小——128,000个令牌(约相当于一本书的长度),其知识截止于2023年10月;不过,新模型的具体大小尚未透露。目前,模型API支持文本和视觉能力,未来计划加入视频和音频功能。此公告在OpenAI近期公布其备受期待的声音模式集成GPT-4o之后发布。该公司透露,较小的alpha版本预计将在7月底推出,更多用户将于今秋获得该功能。