谷歌正在升级其数据库和分析平台,以赋能开发者和企业,利用生成式人工智能的强大功能。
在2024年,谷歌推出了几项针对Gemini大语言模型(LLM)的更新,旨在扩展其应用范围。最近,谷歌宣布将Gemini模型集成到BigQuery分析服务中,同时引入了AI数据准备和增强生成(RAG)的新功能。此外,谷歌通过在所有云数据库中引入向量搜索支持,显著增强了其AI数据库的能力。
谷歌云数据库总经理Andi Gutmans表示:“我们相信,向量索引和向量搜索应成为每个数据库的基础。数据库在有效的增强生成中发挥着关键作用,最大限度地利用企业中的人工智能优势。”
向量搜索现已在所有谷歌数据库中可用
虽然谷歌之前已在部分数据库中提供向量支持,但现在此功能已扩展到所有产品。谷歌的AlloyDB数据库已经具备了向量和AI功能,并现已正式推出。此外,谷歌的Vertex AI向量搜索服务作为专用的向量数据库,进一步完善了这些创新。
新功能包括对内存中的Redis Memorystore、CloudSQL、Spanner关系数据库、Firestore文档数据库以及Bigtable键值数据库的向量预览支持。
为了在所有谷歌数据库中整合向量搜索,需要大量的工程努力。Gutmans指出,对于基于开源PostgreSQL框架构建的AlloyDB,谷歌利用开源技术pgvector来实现向量支持。但谷歌投入了大量工作,以优化用户的性能和功能体验。
“由于各个数据库具有特定的架构差异,我们必须在不同的工作流中进行创新,”Gutmans说道。
通常,要使用向量搜索,数据库需要额外的索引。Gutmans强调,谷歌的强项在于构建具有向量能力的索引,依靠多年来在大型服务中积累的经验。
“在这样的规模下运作,我们对向量能力有着深刻的理解,已在我们的广告和搜索部门内部利用这些技术超过十年,”他解释道。
BigQuery增强了对Gemini Pro模型的支持
在分析方面,谷歌正在通过支持最新的Gemini Pro模型来增强BigQuery。
谷歌云数据分析总经理Gerrit Kazmaier在最近的一次新闻圆桌会议上表示:“这开启了一系列新的分析场景。”
这些先进的功能包括对结构化和非结构化数据的总结、情感提取、分类、丰富以及翻译等方面的改进。Kazmaier强调,企业中的大量数据仍未得到充分利用,尤其是非结构化数据。
“有了Gemini Pro和BigQuery,用户现在可以无缝分析丰富的非结构化数据与结构化数据,”他补充道。