經過數月的猜測與期待,OpenAI正式推出其先進推理模型的生產版本,現在稱為「o1」。同時,還推出了一個「迷你版」,類似於GPT-4o,承諾能帶來更快、更靈敏的互動,並使用較小的知識庫。
o1模型具備多項技術改進。這是OpenAI首個旨在模仿人類推理的推理模型,能夠在數學、科學和編程等多個主題上,更迅速地解決複雜問題。
例如,在測試中,o1參加了國際數學奧林匹克的資格考試。雖然GPT-4o的正確率僅為13%,但o1憑藉83%的驚人準確率脫穎而出。在一次線上Codeforces競賽中,o1則位於第89百分位。此外,它能解答以往模型無法解決的問題,比如判斷9.11與9.9哪個數字更大。然而,OpenAI明確表示,此次發布僅是模型潛力的初步展現。
新推出的o1「採用了獨特的優化算法和專為其設計的創新訓練數據集」,OpenAI研究主管Jerry Tworek解釋道。通過結合強化學習和「思維鏈」推理,o1生成的推論比其前代更為精確。Tworek也指出,「我們發現這個模型的幻覺現象較少,但我們無法聲稱完全消除了幻覺。」
從今天開始,ChatGPT-Plus及Teams的訂閱用戶可以探索o1和o1-mini。企業和教育用戶預計下週也將獲得訪問權限。OpenAI預計,o1-mini最終會向免費用戶開放,但尚未提供具體時間表。開發者需注意,o1的API價格相比GPT-4o顯著提高。o1的使用費用為每百萬輸入令牌15美元(而GPT-4o為每百萬5美元),輸出令牌則為每百萬60美元,是4o每百萬5美元的四倍。一個值得注意的問題是:這個新模型認為「strawberry」這個詞中有多少個R?