Salesforce推出了一個突破性的AI模型,可能會徹底改變設備端人工智慧的格局。這個名為「Tiny Giant」的全新xLAM-1B模型僅擁有10億個參數,但在功能調用任務中卻超越了OpenAI和Anthropic等業界巨頭。
這一令人矚目的發展來自Salesforce AI Research,得益於他們創新的數據策劃策略。團隊開發了APIGen,一個自動化管道,用於生成高質量、多樣化且可驗證的數據集,專門用於訓練AI模型以執行功能調用。
研究人員指出:「我們展示了使用我們策劃的數據集訓練的模型,即使只有70億個參數,依然在伯克利功能調用基準測試中達到頂尖表現,超越了幾個GPT-4模型。」他們補充道,「特別值得注意的是,我們的10億參數模型優於GPT-3.5 Turbo和Claude-3 Haiku。」
高效AI的潛力
xLAM-1B模型的小型化對於設備端應用尤其重要,因為大型模型在該環境中變得不切實際。這一進展對企業AI來說具有巨大潛力,能夠支持更強大且響應迅速的AI助手,運行於智能手機和計算資源有限的設備上。
該模型的卓越性能源自其訓練數據的質量和多樣性。APIGen管道使用了3,673個可執行的API,涵蓋21個類別,每個數據點經過三階段的嚴格驗證過程:格式檢查、功能執行和語義驗證。
這一方法顯示出AI開發策略的關鍵轉變。儘管許多公司致力於創造越來越大的模型,Salesforce則展示了重視數據質量能夠導致更高效且有效的AI系統。透過將數據策劃置於模型大小之上,Salesforce成功製作出能夠執行複雜任務的模型,其參數數量遠少於競爭對手。
挑戰AI現狀
這一突破的影響超越了Salesforce本身。通過證明小型且高效的模型能夠與大型模型競爭,Salesforce挑戰了AI領域的傳統觀念。這可能激發一波新研究,專注於優化AI,而非僅僅增加模型的大小,這將有助於減少高級AI功能所需的龐大計算資源。
此外,xLAM-1B的成功可能將加速設備端AI應用的增長。當前,許多先進的AI功能依賴於雲計算,這是因為它們的模型大小和複雜性。如果像xLAM-1B這樣的小型模型能提供類似的功能,將使高效能AI助手能夠直接在用戶設備上運行,提升響應速度並緩解與雲端解決方案相關的隱私問題。
研究團隊已將其60,000個高質量功能調用示例的數據集公開,促進該領域的進一步探索。他們表示:「通過提供這個數據集,我們希望惠及研究社群,並鼓勵未來的進步。」
開創設備端AI的未來
Salesforce執行長Marc Benioff在Twitter上對這一成就表示讚賞,強調「設備端代理AI」的潛力。這一發展可能標誌著AI領域的重大變革,挑戰了「大型模型必然更優」的觀念,並為資源受限環境中的創新AI應用鋪平道路。
這一進展的影響不僅限於Salesforce當前的產品。隨著邊緣計算和物聯網設備的日益普及,對強大設備端AI的需求將持續增長。xLAM-1B模型的成功可能促進一種新的發展趨勢,專注於為特定任務優化的高效模型,從而擺脫傳統的單體結構。這一演進可培養一個分散式AI生態系統,專用模型在設備網絡中協同工作,提供更有效、響應迅速且關注隱私的AI服務。
此外,這一進展還可能使AI能力的獲取更加民主化,讓小型企業和開發者能無需龐大的計算資源便可創建複雜的應用程式。它還可能有助於減緩AI的環境影響,因為小型模型在訓練和運行時所需的能源大幅減少。
隨著行業評估Salesforce突破的影響,一個事實顯而易見:在AI領域,即使是小型模型也能挑戰並潛在超越大型競爭者。AI的未來可能不僅僅存在於雲端,它也許就攤在你的手心裡。