Google 正在提升其數據庫和分析平台,以便為開發者和組織提供生成式 AI 的能力。2024 年,Google 對其 Gemini 大型語言模型(LLM)進行了多項更新,進一步擴展其功能。近期,Google 宣布將 Gemini 模型整合到 BigQuery 分析服務中,並推出新的 AI 數據準備以及檢索增強生成(RAG)功能。此外,Google 透過在所有雲端數據庫中引入向量搜索支持,顯著擴展其 AI 數據庫能力。
“我們相信向量索引和向量搜索應成為每個數據庫的基本功能,”Google Cloud 數據庫總經理兼副總裁 Andi Gutmans 說道。“數據庫在有效的檢索增強生成中扮演著至關重要的角色,並最大化企業中 AI 的好處。”
向量搜索現已在所有 Google 數據庫中提供
雖然 Google 之前已在某些數據庫中提供向量支持,但現在將此功能擴展到所有服務。Google 的 AlloyDB 數據庫已展示其向量和 AI 能力,現在正式推出。此外,Google 的 Vertex AI 向量搜索服務作為專用的向量數據庫,進一步增強了這些功能。
新功能包括對記憶體內 Memorystore for Redis、CloudSQL、Spanner 關係數據庫、Firestore 文檔數據庫和 Bigtable 鍵值數據庫中的向量的預覽支持。
在所有 Google 數據庫中整合向量搜索需要大量的工程努力。Gutmans 指出,Google 在基於開源 PostgreSQL 框架的 AlloyDB 中,利用了開源的 pgvector 技術來實現向量支持。儘管如此,Google仍進行了大量的工作以優化性能和用戶功能。
“由於每個數據庫都有特定的架構特點,我們必須在多個工作流程中進行創新,”Gutmans 說。
為了便於使用向量搜索進行查詢,數據庫通常需要額外的索引。Gutmans 強調,Google 的優勢在於構建具向量能力的索引,這得益於多年來為主要服務規模化運行的經驗。
“在這樣的規模運營下,我們深刻理解向量能力,並在廣告和搜索部門內部使用了超過十年,”他解釋道。
BigQuery 加強了 Gemini Pro 模型的支持
在分析方面,Google 正在增強 BigQuery,支持其最新的 Gemini Pro 模型。“這開啟了一系列新的分析場景,”Google Cloud 數據分析總經理兼副總裁 Gerrit Kazmaier 在近期的一次新聞圓桌會議中表示。
這些先進的功能包括改進的總結、情感提取、分類、數據豐富和結構化、非結構化數據的翻譯。Kazmaier 強調,許多企業數據仍未得到充分利用,特別是非結構化數據。“藉助 Gemini Pro 和 BigQuery,用戶現在可以無縫分析豐富的非結構化數據以及結構化數據,”他補充道。