自2023年3月OpenAI推出强大的GPT-4大型语言模型(LLM)以来,用户和开发者们一直期待其后续产品GPT-5的发布。然而,OpenAI选择了一条不同的道路,推出了新的模型系列:o1系列。
o1模型系列介绍
OpenAI最近发布了最新的人工智能模型,o1-preview和o1-mini,旨在更有效地处理复杂任务和解决各种问题。这些模型目前已向ChatGPT Plus用户开放,其中o1-preview每周限制30条消息,o1-mini可发送50条消息。需要注意的是,作为早期模型,它们的功能仍在不断开发中,尚缺少GPT-4所具备的网页浏览和文件上传功能。
o1模型的卓越能力
OpenAI表示,o1系列在处理科学、医疗和技术等多个领域的复杂问题方面表现出色。这些模型可以帮助物理学家制定复杂方程,并协助医疗研究人员有效标注细胞测序数据。
o1-mini模型为开发者提供了强大的特性,非常适合执行多步骤工作流程、调试代码和解决编程难题。
o1-preview:博士级表现
o1-preview模型为深思熟虑的响应分配了更多时间,模仿人类的问题解决方式。测试表明,其在物理、化学和生物学等领域的表现相当于博士生水平。在编码方面,它在Codeforces竞赛中排名89百分位,展现出高超的调试和解决方案生成能力。在国际数学奥林匹克资格赛中,它解决了83%的题目,远超GPT-4的13%成功率。
该模型目前面向ChatGPT Plus和团队用户开放,企业和教育用户将在下周获得访问权限。此外,符合条件的API 5级开发者也可以使用o1模型,尽管最初会有速度限制。
o1-mini:经济而高效
与o1-preview同时推出的o1-mini模型是一款简化版,它提供更快且更经济的推理能力。虽然专注于编码和STEM领域,o1-mini在IMO数学基准测试中也表现优异,得分达到70%,接近o1-preview的74%分数,但成本显著更低。在编码评估中,它在Codeforces上的Elo得分为1650,位居编程者的前86%。
o1-mini的价格比o1-preview低80%,其设计旨在满足开发者和研究者的需求,让他们在无需深入知识的情况下,获取强大的推理能力。该模型将面向ChatGPT Plus、团队、企业和教育用户,未来计划纳入ChatGPT Free用户。
安全性和保障提升
OpenAI对安全性的承诺在这两个模型中体现得淋漓尽致,具备增强的安全训练机制。o1-preview模型在一项极具挑战性的越狱评估中得分高达84,远超GPT-4的22分。这些模型更能针对安全协议进行合理推理,从而更好地处理不安全的提示,降低生成不当内容的风险。
OpenAI还与美国和英国的人工智能安全机构建立了合作关系,以促进未来人工智能系统的评估与测试。
o1系列未来发展
尽管o1-preview和o1-mini已是强大的问题解决工具,OpenAI意识到这仅仅是开始。公司计划定期增强这些模型,未来将添加浏览、文件上传和功能调用等新特性。
随着OpenAI继续推进GPT和o1系列的发展,用户可以期待未来不断提升的能力与更广泛的应用。