隨著生成式人工智能的進步,企業發現基本的聊天機器人已經無法滿足需求。雲端巨頭們正在迅速提升其數據庫和工具,以實現操作數據的快速、高效部署,幫助企業打造智能且具上下文理解能力的應用程序。
最為突出的例子是 Google Cloud 最近對其數據庫產品的更新,從 AlloyDB 開始。在最新的部落格文章中,Google 宣布其完全管理的 PostgreSQL 相容數據庫,現已正式推出 ScaNN(可擴展最近鄰)向量索引。這項技術支撐著 Google Search 和 YouTube,使索引創建和向量查詢更快速,同時顯著降低內存消耗。
此外,Google 已與 Aiven 建立夥伴關係,提供 AlloyDB 的管理部署,並為 Memorystore for Valkey 和 Firebase 推出了更新。
理解 ScaNN 在 AlloyDB 中的價值
向量數據庫是支持先進 AI 工作負載的關鍵,涵蓋 RAG 聊天機器人和推薦系統。它們擅長於存儲和管理向量嵌入(數值數據表示),並進行針對應用程序至關重要的相似性搜尋。隨著 PostgreSQL 成為全球開發者的首選數據庫,其向量搜尋擴展 pgvector 獲得了廣泛的關注。Google Cloud 在 AlloyDB 上支持此功能,並利用名為層次可導航小世界(HNSW)的先進圖形算法進行向量操作。但 HNSW 在處理超大型向量工作負載時性能會下降,導致應用延遲和內存使用增加。
為了解決這些挑戰,Google Cloud 在 AlloyDB 中推出了 ScaNN 向量索引。這一創新索引利用與 Google Search 和 YouTube 相同的技術,提供最多四倍的查詢速度和八倍的索引創建速度,而內存消耗僅為標準 PostgreSQL HNSW 索引的 3-4 倍。Google Cloud 數據庫工程副總裁 Andi Gutmans 表示:「ScaNN 索引是第一個可以擴展到支持超過十億個向量的 PostgreSQL 相容索引,同時提供卓越的查詢性能,為任何企業實現高性能工作負載。」
Gutmans 還宣布,AlloyDB Omni,即 AlloyDB 的可下載版本,將通過與 Aiven 的合作以管理服務的形式提供,支持在任何環境中部署,包括本地或雲端。他表示:「在單一平台上跨雲運行事務、分析及向量工作負載,輕鬆構建所需的生成式 AI 應用程序。」
Memorystore for Valkey 和 Firebase 的增強功能
此外,Google Cloud 為 Valkey 的管理集群 Memorystore 和 Firebase 應用開發平台推出了升級。Valkey 現在將具備向量搜尋能力,使單個實例能在超過十億個向量的搜尋中以單位毫秒延遲進行相似性搜尋,召回率超過 99%。下一版本 Memorystore for Valkey 8.0 當前處於公眾預覽中,其查詢速度較 Memorystore for Redis Cluster 提升了 2 倍,並配備了新的複製方案、網絡改進和增強的性能可視化功能。
對於 Firebase,Google Cloud 將推出 Data Connect,這是一個後端即服務解決方案,與由 Cloud SQL 支持的完全管理 PostgreSQL 數據庫集成,將於今年晚些時候進入公眾預覽階段。
通過這些創新,Google Cloud 旨在為開發者提供廣泛的基礎設施和數據庫選擇,搭配強大的語言模型,以創建智能應用程序。隨著對生成式 AI 應用的需求預計將顯著上升,Omdia 預測市場將從 2023 年的 62 億美元擴展至 2028 年的 585 億美元,年均增長率高達 56%。