OpenAI 宣布推出一項新功能,讓第三方開發者可以微調其大型多模態模型 GPT-4o。這項定制功能使開發者能夠調整模型的行為,以更有效地滿足應用程序或組織的具體需求。
微調可以調整語氣、遵循特定指導方針,並提高技術任務的準確性,即使在數據有限的情況下也能取得良好效果。對此功能感興趣的開發者可以訪問 OpenAI 的微調儀表板,選擇「創建」,並在基礎模型下拉菜單中選擇 gpt-4o-2024-08-06。此次宣布正值較小且速度更快的變體 GPT-4o mini 推出的背景下,儘管功能較弱,但也可以進行微調。
OpenAI 技術人員 John Allard 和 Steven Heidel 在公司博客中表示:「微調可以顯著提高模型在各個領域的表現,從編程到創意寫作,這僅僅是個開始;我們將不斷擴展模型的定制選項。」
免費代幣供應至 9 月 23 日
OpenAI 強調,開發者只需幾十個訓練示例便可取得驚人結果。為了慶祝這一新功能,OpenAI 提供每日最多 100 萬個免費代幣,用於微調 GPT-4o,活動將持續到 2024 年 9 月 23 日。
代幣是概念的數字表示,對模型的輸入和輸出過程至關重要。開發者必須將數據轉換為代幣(即代幣化),以有效地微調 GPT-4o,並可利用 OpenAI 的工具進行此過程。
通常,微調 GPT-4o 的成本為每百萬代幣 25 美元,而運行微調後的模型需支付每百萬輸入代幣 3.75 美元及每百萬輸出代幣 15 美元。對於使用較小的 GPT-4o mini 的開發者,每天可獲得最多 200 萬個免費訓練代幣,確保微調功能的廣泛訪問。
OpenAI 提供免費代幣的舉措是為了應對來自 Google 和 Anthropic 等專有供應商的激烈競爭,以及基於 Meta 的 Llama 3.1 的開源模型,如 Nous Research 的 Hermes 3。然而,使用 OpenAI 模型的開發者受益於無需在自己的伺服器上進行推理或訓練,能夠利用 OpenAI 的基礎設施,或通過 OpenAI 的 API 連接其伺服器。
成功案例展示微調潛力
GPT-4o 的微調在與選定合作夥伴的廣泛試驗後推出,展示了定制模型在各個領域的潛力。例如,AI 公司 Cosine 以其微調的自主 AI 工程師代理 Genie 在 SWE-bench 基準測試中取得了 43.8% 的最高成績,這是迄今為止公開宣稱的 AI 模型中最高的。
同樣,為財富 500 強企業提供 AI 解決方案的 Distyl 以微調的 GPT-4o 在 BIRD-SQL 基準測試中取得最高排名,執行準確率達 71.83%。該模型在 SQL 任務中表現出色,包括查詢重構和自我修正。
在微調中優先考慮安全性和數據隱私
OpenAI 強調,在擴展開發者選項時,安全性和數據隱私至關重要。微調模型使組織能夠全面控制其數據,確保輸入和輸出不會被用來訓練其他模型。
OpenAI 還實施了多項安全措施,包括自動評估和使用監控,以保持符合其政策。然而,研究顯示,微調有時可能導致偏離安全規範,並影響整體模型表現。最終,組織必須權衡微調的潛在風險與收益。
隨著微調能力的推出,OpenAI 鞏固了其願景,認為未來大多數組織將開發適合其行業或特定業務需求的模型。這一新產品標誌著向該目標邁出重要一步,顯示出 OpenAI 致力於讓每個組織擁有自己的定制 AI 模型。