理解 OpenAI 的新 o1-Preview 和 o1-Mini 模型:開發者的關鍵見解

OpenAI昨日震驚科技界,推出了一款新的推理大型語言模型(LLM)系列,名為「o1」,而非預期的「Strawberry」或GPT-5。這些o1模型專為科學、技術、工程和數學(STEM)任務而設計,提供高效能和高準確性。

目前有兩款新模型可供使用:o1-preview和較低參數的o1-mini。這些模型對於ChatGPT Plus用戶及使用OpenAI付費API的開發者可用,方便他們將模型整合進現有應用程式或創建新應用程式。

增強的推理能力

OpenAI的API技術負責人Michelle Pokrass表示,o1模型採用先進的推理技術,能夠調整策略、從錯誤中學習,並經歷深入的認知過程。測試顯示,這些模型在挑戰性基準測試中表現相當於博士生。

OpenAI的Nikunj Handa指出,o1模型在推理相關任務中顯著超越GPT系列。

開發者重要細節

- 文字輸出唯一性:目前這兩款模型僅支持文本輸入和輸出,對於需要多模態能力(如圖像或文件分析)的任務不太適合。對於這類需求,GPT-4o仍然是推薦選擇。

- 知識截止:o1模型無法瀏覽網頁,僅依賴截至2023年10月的訓練數據,儘管用戶可以通過文本輸入提供額外上下文。

- 回應時間:輸出生成速度較慢,某些回應需超過一分鐘,但早期測試者報告在編碼及起草法律文件等任務上性能有所提升。

OpenAI建議,雖然GPT-4o適合需要更快回應的任務,但o1模型可能更適合需要深入推理的應用。

定價結構

訪問o1模型需要對OpenAI的API進行相當大的投資,僅限於「Tier 5」用戶,這些用戶需至少花費$1,000,並且支付已超過30天。o1-preview模型的價格較高,每百萬個輸入標記需$15,每百萬個輸出標記需$60,而o1-mini則以較低的價格提供,每百萬個輸入標記需$3,每百萬個輸出標記需$12。

目前,o1模型限制為每分鐘20個請求,並不支持請求批量處理。

o1模型的應用

自o1-preview和o1-mini推出以來,開發者已開始探索其應用。一些初步發現包括:

- 文件生成:這些模型能根據簡單提示生成完善的行動計劃和白皮書。

- 營運優化:用戶展示了o1-preview能自動化員工排班、評估合併風險、設計高效倉庫及平衡電網的能力。

- 應用和遊戲開發:o1-preview模型促進了互動應用和遊戲的快速創建。

- RFP自動化:o1模型可以幫助承包商通過處理RFP的文本輸入來完成提案請求文件。

- 策略規劃:開發者注意到o1-preview在生成詳細增長策略方面的有效性,包括利用Reddit等平台進行互動。

訪問OpenAI的o1模型

開發者可通過OpenAI公共API、Microsoft Azure OpenAI服務、Azure AI Studio和GitHub Models訪問o1模型。雖然並非每位開發者都合適,但o1系列的引入為尋求在AI應用中創新的開發者提供了獨特的機會。OpenAI致力於提升o1系列及其現有的GPT系列,為開發者提供多樣選擇。

Most people like

Find AI tools in YBX