Databricks 正在提升企業生成式人工智慧開發者工具,於其年度數據與 AI 大會上,CEO Ali Ghodsi 揭示了 Mosaic AI 平台的重大增強功能。這些升級旨在幫助企業有效部署由大型語言模型(LLM)驅動的應用程式。
Mosaic AI 平台源自 Databricks 以 13 億美元收購 MosaicML,提升了公司在生成式 AI 領域的能力,簡化了 AI 應用程式的開發。最新的功能集中在三個主要領域:1. 建立綜合 AI 系統,2. 通過各種指標評估這些系統,3. 確保整個 AI 流程的治理。
這個強大的端到端生態系統賦予組織創建可靠的生成式 AI 應用程式的能力,讓它們得以利用自身數據。此外,Databricks 的競爭力在於其與 Snowflake 的對抗,後者也在擴展其生成式 AI 提供,包括最近推出的企業級開放 LLM “Arctic”,旨在挑戰 Databricks 的 DBRX。
Databricks Mosaic AI 的新功能
熱衷於生成式 AI 的組織渴望利用這項創新技術開發使用內部數據的應用程式。然而,許多團隊在大模型的投資回報上面臨挑戰,經常難以在預算與隱私限制內提供高品質的輸出。
為了解決這些問題,企業越來越多地採用基於檢索增強生成(RAG)的綜合 AI 系統,這種系統整合了各種小型模型、檢索器、向量數據庫以及評估、監控、安全和治理的工具。Databricks 進一步強化了 Mosaic AI,以促進這些先進系統的創建。
最近,Databricks 在其平台中引入了 Vector AI 搜索,這是一個無伺服器的向量數據庫。最新的功能包括 Mosaic AI 模型訓練和代理框架。模型訓練功能使用戶透過友好的 API 或界面微調小型的開源基礎模型,並在具體任務中優化知識,同時保持成本效益。與此同時,代理框架結合 Mosaic AI 向量搜索和模型服務,利用這些微調模型推動高品質的 RAG 應用程式。
“首先,代理框架通過代理評估簡化了應用程式質量的測量和評估,”Databricks 的產品行銷副總裁 Joel Minnick 說。“它包括專有的 AI 輔助評估工具,能自動評估輸出品質,並提供直觀的追蹤使用者介面以便利害關係人的回饋。這使開發者能夠快速測試假設、迅速迭代並在完整的 LLMOps 工作流程中有效重新部署應用程式。”
該平台還具備 AI 工具目錄,使用戶能通過 Databricks Unity Catalog 進行工具治理、分享及登記,該目錄剛剛開源。此目錄可為綜合 AI 系統增強能力,例如智能代碼生成、網絡搜尋和 API 調用。Unity Catalog 中的任何登記 Python 或 SQL 函數均與 Mosaic AI 工具目錄相容,從而提升輸出品質。
加強治理的 Mosaic AI Gateway
為確保在 AI 應用程式中實現強有力的治理和信任,Databricks 推出了“ Mosaic AI Gateway”。這個工具提供了一個統一的界面,用於查詢、管理和部署開源與專有模型,讓團隊能在不大幅修改應用程式代碼的情況下更換 LLM。
至關重要的是,AI Gateway 配備了內建的治理和監控功能。它能夠跟蹤使用情況和設置保護措施,讓組織可以監控模型使用情況,並建立速率限制以控制成本,同時過濾安全性和個人識別資訊。
所有的新產品功能,除了 AI 工具目錄外,均處於公開預覽中,預計在未來幾個月內普遍可用。AI 工具目錄目前處於私有預覽,尚未公佈更廣泛發布的時間表。此外,Databricks 在活動中還展示了其他幾項重要產品,包括 Databricks AI/BI 用於生成式 AI 的分析工具、Databricks LakeFlow 用於數據工程,以及與 Shutterstock 共同開發的專用圖像生成模型。
Databricks 數據與 AI 峰會將於 2024 年 6 月 10 日至 6 月 13 日舉行。