Snowflake 數據雲擴展多模態大型語言模型 (LLM)
在 Sridhar Ramaswamy 的帶領下,Snowflake 數據雲正藉由整合多模態大型語言模型(LLM)來提升其功能。該公司與 AI 新創企業 Reka 合作,此公司由前 DeepMind、Google 和 Meta 的研究人員成立,將其專有模型整合到 Snowflake 的數據平台中。
此合作關係是繼 Snowflake 最近與 Mistral 的合作之後,將使得使用數據雲的企業能夠開發能處理文本、圖片和視頻的生成式 AI 應用程式,為團隊挖掘數據集的新見解鋪平道路。
去年的 Reka 6000 萬美元融資輪中,Snowflake 有參與,但尚未確認是否會通過此合作增加投資。Snowflake AI 產品管理負責人 Baris Gultekin 表示,公司不斷尋求支持合作夥伴並促進客戶創新,儘管未透露投資的具體細節。
在 Snowflake Cortex 中推出 Reka Flash 和 Core
自推出以來,Snowflake 一直致力於成為客戶首選的數據基礎設施。最初提供基本的數據倉庫,Snowflake 隨著時間演變,支持多種數據格式和功能,發展成為全面的數據雲,滿足各種 AI 和分析應用需求。
為了應對生成式 AI 的蓬勃發展,Snowflake 推出了 Snowflake Cortex,這是一項針對開發 LLM 應用的完全管理服務。Cortex 提供企業一系列 AI 基石,包括開源 LLM,使其能夠在開發針對特定商業需求的應用時安全分析數據。該公司最初專注於用於情感分析的專門 LLM,現在擴展至包括 Reka 的兩個模型:Flash 和 Core。
Reka Flash 是一個最先進的模型,擁有 210 億個參數,經過優化以在語言和視覺基準測試中提供與大型模型相當的性能。而 Core 是 Reka 最大的模型,接近 GPT-4 和 Gemini Ultra 等先進模型的性能,但目前尚不對外公開。
Snowflake 計劃立即將 Flash 模型整合至 Cortex,Core 模型的支持正在開發中,以便未來發布。儘管 Gultekin 未透露具體時間表,但他表示這將很快推出,並提及根據需求增加其他 Reka 模型的可能性。
多模態 AI 為 Snowflake 用戶帶來的好處
隨著 Cortex 和 Reka AI 模型的整合,Snowflake 用戶可創建能處理文本、圖片和視頻的生成式 AI 應用。這項功能支持多種應用,如視頻字幕、圖片標籤、為電子商務生成產品描述以及分析圖形數據。
Gultekin 強調了幾種潛在應用,包括解讀圖表的聊天機器人和為娛樂企業生成營銷內容,利用他們的視頻和圖像資產。
雖然 Gultekin 沒有透露具體使用 Reka 模型的公司數量,但他表示超過 400 家企業正在利用 Cortex 及其托管模型開發生成式 AI 應用,這些應用涉及各個領域,從識別服務票的安全漏洞到改善醫療提供者與保險公司數據之間的溝通。
Reka 模型的加入將使得 Cortex 中可用的 LLM 總數擴展至 12 個,並與剛剛推出的 Mistral 和 Google 進行結合。
Gultekin 將 Snowflake 的 AI 創新流程形容為「全速前進」,目標是讓所有用戶均可輕鬆接觸 AI,以快速驅動有意義的業務成果。他暗示在六月的年會之前會有進一步的 AI 發展公告。
「我們的路線圖反映了有效的 AI 策略應建立於堅實的數據策略之上——數據是 AI 的燃料。我們致力於提升 AI 和 ML 工作流的生產力、協作及整體效率,這一切建立在 Snowflake 安全與可信的數據基礎之上,」Gultekin 表示。
值得注意的是,數據生態系統的競爭對手 Databricks 也在實施類似的方法。繼收購 MosaicML 後,該公司推出了開源模型及改善工具,以發展生成式 AI 應用。最近,Databricks 收購了專注於分析與完善非結構化數據以供 AI 訓練的 AI 新創企業 Lilac。