介绍OpenAI的突破性“草莓项目”模型:现已上线!

经历了数月的猜测与期待,OpenAI正式推出了其先进推理模型的生产版本,现称为“o1”。此外,还推出了类似于GPT-4o的“mini”版本,承诺在使用更小知识库的同时,提供更快更灵敏的互动。

o1模型具备一系列技术改进。这是OpenAI首个设计用于模拟人类推理的模型,使其能够更迅速地处理涉及多个学科(如科学、编程和数学)的复杂问题。

例如,在测试中,o1面对国际数学奥林匹克的资格考试。与GPT-4o仅有13%的正确率相比,o1的准确率高达83%。在一场在线Codeforces竞赛中,o1位列第89百分位。此外,它还能解决早期模型无法解答的问题,比如判断9.11和9.9哪个更大。然而,OpenAI强调,此次发布只是展示了该模型完整潜力的一部分。

OpenAI的研究主管Jerry Tworek解释道:“o1是通过一种独特的优化算法和特别为其设计的创新训练数据集开发的。”通过结合强化学习和“思考链”推理,o1生成的推断比其前身更为精确。Tworek提到:“我们观察到该模型的幻觉现象较少,”但他也提醒,“我们不能声称已经完全消除了幻觉。”

从今天起,ChatGPT-Plus和Teams订阅者可以体验o1和o1-mini。企业和教育用户预计将在下周获得访问权限。OpenAI预计,o1-mini最终会向免费用户开放,但尚未提供具体时间表。开发者需注意,o1的API定价相比于GPT-4o有显著提高,o1的输入令牌费用为每百万个15美元(而GPT-4o为每百万5美元),输出令牌费用为每百万60美元,是4o的四倍(5美元每百万)。一个有趣的问题是:新模型认为“strawberry”这个词中有多少个“r”?

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles