隨著企業愈加擁抱人工智慧(AI)技術,它們面臨一個關鍵挑戰:如何為每個任務選擇最佳的AI模型,並在性能與成本之間取得平衡。模型路由作為一項突破性解決方案,幫助組織最大化AI效率。
模型路由技術使企業能夠根據每次查詢動態選擇最合適的AI模型,從根本上改變了它們利用AI資源的方式。這種方法提高了性能,並相較於依賴單一通用模型大幅降低了成本。
Martian:開創AI模型路由的先驅
在這一領域中,一個值得注意的創業公司是Martian,它開發了一種創新的大型語言模型(LLM)路由器,引起了多家領先科技公司的關注。最近,全球專業服務公司Accenture宣布對Martian進行投資,突顯了模型路由在企業AI策略中的日益重要性。
Accenture計劃將Martian整合進其調度服務中,以幫助企業進行模型選擇。自2023年11月脫離潛伏模式以來,Martian穩步推進其技術,現在在其路由平台上推出了新的AI模型合規性功能。
Accenture的調度服務曾經協助企業進行模型選擇,但Martian通過動態路由增強了這一能力,實現每次查詢自動選擇最佳模型。“這樣可以降低成本並提高性能,因為不必始終使用單一模型,”Martian的聯合創始人Shriyash Upadhyay解釋道。
Accenture首席AI官Lan Guan指出,許多客戶希望利用生成式AI,並考慮性能和成本指標。“Accenture的調度服務與Martian的動態LLM路由相結合,簡化了用戶體驗,使企業能探索符合其獨特需求的生成式AI,”Guan表示。
Martian如何優化AI查詢路由
Martian的模型路由器巧妙地為每個查詢選擇最佳AI模型,利用核心技術來預測模型行為。Upadhyay強調了他們的獨特方法,“我們專注於理解這些模型的內部運作,因為一個模型包含足夠的信息來預測自己的行為。”
這一策略使Martian能夠準確識別執行的最佳模型,優化成本、輸出質量和延遲等因素。模型壓縮、量化、蒸餾和專門模型等技術,使這些預測能在不運行完整模型的情況下實現,從而提高性能並降低成本,相較於靜態模型選項。
企業AI中模型路由的必要性
雖然在商業中使用最佳工具的原則早已確立,但許多組織對各類AI模型的選擇仍然缺乏認識。Upadhyay指出,“大型公司的不同部門一般對可用的專門模型範圍知之甚少。”
為了有效利用AI模型,明確成功指標至關重要。組織需要確定定義成功的指標,並識別特定應用的關鍵目標。成本優化和投資回報同樣重要。根據Upadhyay的說法,模型路由有效地解決了這兩方面的需求。
合規性也是企業面臨的一大挑戰,Martian正通過其新的合規性功能來應對。該功能使企業能夠審核和批准用於應用的AI模型,自動建立合規政策。
用模型路由變革代理型AI
模型路由在蓬勃發展的代理型AI領域中扮演著至關重要的角色,這裡AI代理通過鏈接多個模型和行動來實現預期結果。代理工作流程中的每一步都依賴於前一步,因此錯誤可能會累積。Martian的動態路由確保在每個階段應用最合適的模型,保持高準確性。
“代理型AI是一個具有說服力的路由應用案例;每一步的精度對於避免連鎖失敗至關重要,”Upadhyay總結道。