Databricks,這家快速增長的企業軟件公司,推出了DBRX,一個突破性的開源人工智能模型,旨在重新定義AI的效率和性能標準。DBRX擁有1320億個參數,在語言理解、程式設計能力和數學能力等關鍵領域超越了Llama 2-70B和Mixtral等領先的開源模型。
雖然DBRX不及OpenAI的GPT-4,Databricks的高層強調,DBRX是一個更具效率和成本效益的替代方案,面對GPT-3.5。Databricks首席執行官Ali Ghodsi在最近的新聞發布會中表示:“我們很高興向全球介紹DBRX,推進開源AI。儘管像GPT-4這樣的模型是優秀的通用工具,我們的重點是創建量身定制的模型,以深入理解客戶的專有數據,DBRX正是我們承諾這一使命的例證。”
DBRX在語言理解(MMLU)、程式設計(Human Eval)和數學(GSM 8K)的基準測試中表現出色。儘管它尚未超越GPT-4,但相較於廣泛使用的GPT-3.5,已顯著提升。
DBRX的一大特點是其創新的“專家混合”架構。不同於競爭對手在每次字詞生成時使用所有參數,DBRX使用16個專家子模型,每次僅激活四個相關專家進行計算。這一設計在任何時刻僅使用360億個參數,從而實現更快且更具成本效益的運行。
去年被Databricks收購的Mosaic團隊,基於其之前的Mega-MoE計劃,首創了這種方法。Ghodsi表示:“Mosaic團隊在有效訓練基礎AI模型方面的能力已達到了一個新高,我們能迅速產出高質量的AI模型——DBRX的開發大約花了兩個月,成本約一千萬美元。”
通過開源DBRX,Databricks期望在先進AI研究中佔據領導地位,並促進其創新架構的廣泛應用。這項發布也與Databricks專注於建立和托管針對特定客戶數據集的定制AI模型的主要方向一致。
目前,許多Databricks客戶仍依賴於OpenAI的GPT-3.5。然而,使用第三方模型處理敏感企業數據存在安全隱患。Ghodsi指出:“我們的客戶信任我們管理來自全球各地的受管制數據。由於他們的數據已在Databricks,DBRX在確保數據安全的同時,向他們提供先進的AI能力。”
儘管DBRX並不直接與GPT-4競爭,但在語言理解、程式設計和數學的基準測試中,它顯著超越GPT-3.5,成為成本更低的可行開源替代方案。
DBRX的推出恰逢數據和AI平台領域競爭加劇,競爭對手如Snowflake相繼推出類似功能,而大型雲服務提供商也在加強其生成AI產品。通過在高級開源研究中確立自己的地位,Databricks力求成為AI領袖,並吸引頂尖數據科學人才。此外,此次發布還利用了對大型科技公司商業AI模型日益增長的懷疑,這些模型往往被視為不透明。
DBRX的真正考驗將在於其被採用的程度和為Databricks客戶所帶來的價值。隨著企業越來越希望利用AI的同時保留對專有數據的控制,Databricks相信其尖端研究和強大企業平台的獨特組合將使其在競爭中脫穎而出。
隨著DBRX的推出,Databricks向大型科技公司和開源競爭對手發出挑戰,呼籲他們與其創新進展相匹配。隨著AI領域競爭的加劇,Databricks將成為重要的市場參與者。