Databricks 數據與人工智慧高峰會 2024:揭開最重要的創新面紗

Databricks年度高峰會持續吸引數據生態系統中的各方參與者,成為一場生機勃勃的聚會。每年,公司均會推出創新技術、合作夥伴關係和進展,旨在簡化結構化與非結構化數據的管理。今年的高峰會延續了這一傳統,特別強調人工智能(AI)的應用。

在開幕演講中,首席執行官Ali Ghodsi介紹了數據與AI交匯處的一系列創新,重申公司在Databricks數據智能平台上優化受管數據集的承諾。此次高峰會的主要亮點包括Mosaic AI的升級——一個圖像生成模型,及一款旨在提升數據分析效率的生成式AI解決方案。

以下是本年度高峰會的主要公告:

1. Unity Catalog 開源

為了在Snowflake的Polaris Catalog中獲得競爭優勢,Databricks將其Unity Catalog在Apache 2.0授權下開源,並附有OpenAPI規範。這使其他公司可以利用此架構和代碼,創建支持Iceberg和Delta/Hudi等多種數據格式的目錄。代碼在開幕演講中即時分享,預計Snowflake也將在90天內跟進。

2. Mosaic AI 升級至生產級系統

Mosaic AI工具包獲得了重要升級,旨在幫助團隊創建可信的實用復合AI系統。新功能包括Mosaic AI模型訓練產品、AI代理框架、評估框架以及AI工具目錄和治理AI網關。除了AI工具外,所有產品目前均在公共預覽中。

3. 企業專用的文本轉圖像模型

Databricks推出了Shutterstock ImageAI的私人預覽,這是一款生成式AI模型,使企業能夠創建高保真圖像,滿足各種商業應用需求。該模型經過Mosaic AI和Shutterstock的可靠圖像集預訓練,通過Shutterstock的圖像生成器可輕鬆訪問,並且可通過Mosaic AI進行微調或通過API進行集成。

4. Databricks AI/BI 智能分析

為了幫助企業普及分析見解的獲取,Databricks推出了Databricks AI/BI,這是一個與數據智能平台相結合的復合AI系統。通過AI代理——Dashboards和Genie,該系統可以解讀商業查詢並生成自然語言回答及可視化展示。每個代理專注於特定功能,如計劃、SQL生成和可視化,並配有回應排序和向量索引等附加組件。該產品對所有Databricks SQL Pro和無服務器客戶開放,Dashboards已正式推出,Genie則處於公共預覽中。

5. Databricks LakeFlow 簡化數據工程

Databricks還推出了LakeFlow,這是一個統一體驗,旨在簡化數據工程的所有方面,包括數據攝取、轉換和編排。LakeFlow透過自動化管道的部署、運行和監控,簡化了傳統上複雜的數據管道建設與維護過程,並提供強大的CI/CD和大規模質量檢查支持。儘管尚未進入預覽階段,Databricks已開放早期訪問的等候名單。

6. 與Nvidia和Gretel的合作

最後,Databricks宣布與Nvidia和Gretel建立重要夥伴關係。與Nvidia的合作旨在將對CUDA加速計算的原生支持融入Databricks的下一代向量化查詢引擎Photon,提升數據倉儲和分析工作負載的性能。與Gretel的合作使其成為ISV技術合作夥伴,為在Databricks平台上開發和定制機器學習模型提供高品質的合成數據集。

Most people like

Find AI tools in YBX