儘管經過數月的猜測,OpenAI於上週推出的Project Strawberry仍讓許多分析師感到意外,他們認為該模型可能在幾週後或至少要等到這個秋天才能推出。全新的o1-preview模型及其o1-mini變體現在可供使用與評估。以下是獲取訪問權限的方法。
OpenAI推出的o1預覽版是一系列革命性的AI模型,旨在加強推理能力,讓模型在生成回應前能進行深入思考。這些模型在解決科學、編程和數學等複雜任務方面表現優異。
什麼是o1?
OpenAI的人工通用智能(AGI)野心早已為人所知,而Project Strawberry(現已重新命名為“o1”)則是邁向該願景的重要一步。此系列的新首款模型專注於推理,設計宗旨為在回應前“多花時間思考”。這種方法使得模型能有效地應對複雜任務,解決比以往更困難的問題,在科學、編程和數學等領域取得佳績。這些模型旨在模仿人類的推理過程,使其在訓練中能夠精煉思維、實驗不同策略及從錯誤中學習。OpenAI聲稱,o1-preview在物理、化學和生物等科目上,表現可與博士生媲美,在這些學科的基準評估中取得良好成績。除了在科學領域的優勢外,o1在編碼和數學挑戰方面同樣出色,在國際數學奧林匹亞(IMO)預選賽中取得83%的成績,遠超GPT-4o的13%,並在Codeforces競賽中進入前89百分位,與人類參賽者競爭。
o1-mini又是什麼?
o1-mini是標準o1-preview模型的簡化版,其運行成本 reportedly 低80%。這使其在編程分析和生成任務中尤為有效。
o1-preview是否可供測試?
是的,o1-preview模型於9月12日推出,僅限於ChatGPT Plus和Teams訂閱用戶使用。企業用戶和教育用戶將於下周開始獲得訪問權。
o1的安全性如何?
據報導,o1的開發採取了加強的安全措施。OpenAI建立了一個新的安全培訓計劃,利用模型的高級推理能力,確保更嚴格遵守安全與對齊協議。值得注意的是,在測試中,GPT-4o在抵抗越獄嘗試的得分僅為22(滿分100),而全新o1模型獲得了驚人的84分。
我該如何訪問o1-preview?
目前,新推出的o1-preview僅對付費訂閱用戶開放。若要試用,您需要每月20美元的Plus訂閱。請點擊左側導航欄中的升級計劃選項,並按照螢幕提示輸入付款詳細資料。一旦訂閱生效,您可以在ChatGPT首頁左側的模型選擇器中選擇o1-preview或o1-mini。請注意,即使是訂閱用戶,o1-preview的每週消息量上限為30條,而o1-mini為50條。OpenAI已表示,o1-mini將來會提供給免費用戶,但具體時間尚未確定。