OpenAI昨日颠覆了科技界,推出了名为“o1”的新一代推理大型语言模型(LLMs),这一名称不同于预期的“草莓”或GPT-5。o1模型专为科学、技术、工程和数学(STEM)任务而设计,提供高性能和高精度。
现在有两个新模型可供使用:o1-preview和参数更少的o1-mini。这些模型向ChatGPT Plus用户和使用OpenAI付费API的开发者开放,方便他们将模型整合进现有应用或创建新应用。
提升的推理能力
根据OpenAI API技术负责人Michelle Pokrass的说法,o1模型利用了先进的推理技术,能够调整策略、从错误中学习,并经过全面的认知过程。在测试中,这些模型在挑战性基准测试中表现出色,达到博士生的水平。OpenAI的Nikunj Handa指出,o1模型在推理相关任务上显著优于GPT系列。
开发者关注要点
- 仅限文本输出:目前,两个模型仅支持文本输入和输出,因此不适合需要多模态能力的任务,例如图像或文件分析。对于这些需求,GPT-4o仍然是推荐选择。
- 知识截止:o1模型无法浏览网络,仅依赖于截至2023年10月的训练数据,用户可以通过文本输入提供额外上下文。
- 响应时间:生成输出的速度较慢,某些回复超过一分钟,但早期测试者报告在编码和起草法律文件等任务中表现有所提升。OpenAI建议,虽然GPT-4o适合快速响应的任务,但o1模型更适合需要深入推理的应用。
定价结构
访问o1模型需要对OpenAI的API进行较大投入,仅限于“Tier 5”用户,这些用户必须至少消费超过1000美元,并在30天前完成付款。o1-preview模型昂贵,每百万个输入标记需15美元,每百万个输出标记需60美元,而o1-mini则相对便宜,每百万个输入标记需3美元,每百万个输出标记需12美元。目前,o1模型每分钟请求限制为20次,不支持批量请求。
o1模型的应用
自o1-preview和o1-mini发布以来,开发者们开始探索其应用。一些初步发现包括:
- 文档生成:模型能够根据简单提示生成完善的行动计划和白皮书。
- 运营优化:用户展示了o1-preview在自动化员工排班、评估并购风险、设计高效仓库和优化电网平衡方面的能力。
- 应用和游戏开发:o1-preview模型可快速创建互动应用和游戏。
- RFP自动化:o1模型可以通过处理RFP的文本输入,帮助承包商完成提案请求文件。
- 战略规划:开发者注意到o1-preview在生成详细的增长策略方面的效果,包括利用Reddit平台进行互动。
访问OpenAI的o1模型
开发者可以通过OpenAI公共API、Microsoft Azure OpenAI服务、Azure AI Studio和GitHub模型访问o1模型。虽然并非适合所有开发者,但o1系列的推出为希望在AI应用中创新的人士提供了独特机遇。OpenAI致力于提升o1系列及其现有GPT系列,为开发者提供多元选择。