OpenAI 2024 開發者日:四項關鍵更新提升人工智慧的可及性與可負擔性

OpenAI於週二舉辦了更為低調的DevDay大會,從去年的高調發布轉向專注於其AI工具和API的漸進式改進。2024年的活動強調賦能開發者並突出社群故事,反映出在競爭日益激烈的AI市場中的戰略轉變。

四大創新亮相

大會介紹了四項主要創新,以提升開發者體驗:Vision Fine-Tuning、Realtime API、Model Distillation及Prompt Caching。每項工具都顯示出OpenAI致力於加強其開發者生態系統,而非直接在終端用戶應用領域競爭。

Prompt Caching:成本效益開發

其中一項亮點是Prompt Caching,旨在降低開發者的成本和延遲。此系統對最近處理過的輸入標記提供50%的折扣,使得頻繁重用上下文的應用能夠顯著節省費用。OpenAI平台產品負責人Olivier Godement指出,成本在兩年內幾乎降低了1000倍,讓初創企業和大公司能夠探索以前過於昂貴的可能性。

DevDay 2024提供的價格表顯示,AI模型使用的成本有顯著降低,對於緩存標記的節省可達50%。新推出的o1模型也引入了高級定價,反映出其增強的能力。

Vision Fine-Tuning:視覺AI的進步

OpenAI為GPT-4o模型推出的Vision Fine-Tuning功能,讓開發者能夠使用文本和圖像自定義模型的視覺理解。這一進步對自駕車、醫療成像和視覺搜索等行業具有深遠的影響。例如,東南亞主要的外送和共乘服務Grab利用此技術改善其地圖服務,只需100個訓練例子便提升了20%的車道數準確性及13%的限速標誌定位,展示出視覺微調對AI應用的變革潛力。

Realtime API:增強對話AI

OpenAI還推出了其公測中的Realtime API,讓開發者能創建低延遲的多模態語音應用,實現語音命令的無縫整合,提升用戶互動。OpenAI展示了升級版的Wanderlust,用戶可以自然地與應用對話規劃旅行,甚至可以在句子中途進行打斷,模擬人類對話。

Realtime API不僅在旅行領域開啟機會,也適用於客戶服務和教育等多個行業。像Healthify和Speak這樣的早期採用者已經整合了該API,提升了醫療和語言學習的用戶體驗。API的定價為每分鐘音頻輸入0.06美元,每分鐘音頻輸出0.24美元,對於希望建造以語音為中心應用的開發者來說,這是一項有價值的投資。

Model Distillation:讓AI更易取得

Model Distillation的公告可能成為遊戲規則改變者,讓開發者能利用高級模型(如o1-preview和GPT-4o)的輸出來提升更高效的模型(如GPT-4o mini)。這種工作流程讓醫療科技初創公司等小型企業能夠在不承擔同樣計算成本的情況下,充分利用高級模型的能力,從而改善弱勢地區的醫療結果。

OpenAI的戰略轉型:專注於可持續增長

OpenAI的2024 DevDay標誌著其朝向培育可持續AI生態系統的戰略轉型,而非追求搶眼的產品發布。雖然這一做法對公眾來說似乎不那麼令人興奮,但它反映出對不斷變化的AI市場的深刻理解,競爭加劇且對數據可用性的擔憂也在增加。

與2023年引人注目的宣布相比,今年對於工具的精練和開發者的賦能顯示出OpenAI旨在維持競爭優勢,同時降低資源消耗和環境影響。隨著OpenAI從擾亂者轉型為平台提供者,其長期成功將取決於加強開發者生態系統。透過提供更好的工具、成本降低及強化支援,OpenAI為各行各業可持續的AI採用奠定了基礎。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles