谷歌云将搜索与 YouTube 技术整合至企业生成式 AI 应用程序中

随着生成式人工智能的进步,企业发现基本聊天机器人已无法满足需求。大型云服务提供商正在迅速增强其数据库及工具,以快速、高效地部署操作数据,从而帮助企业创建智能且具有上下文感知的应用程序。

谷歌云最近对其数据库产品的更新,尤其是AlloyDB,提供了一个典范。谷歌在一篇博客文章中宣布,其完全托管的PostgreSQL兼容数据库现已支持ScaNN(可扩展最近邻)向量索引的全面可用性。这项技术是谷歌搜索和YouTube的核心,能够快速创建索引和执行向量查询,同时显著减少内存消耗。

此外,谷歌还与Aiven合作,提供AlloyDB的托管部署,并为Memorystore for Valkey和Firebase推出了更新。

理解ScaNN对AlloyDB的价值

向量数据库在推动先进AI工作负载(如RAG聊天机器人和推荐系统)中至关重要。它们特别擅长存储和管理向量嵌入(数值数据表示),并进行对特定应用至关重要的相似性搜索。由于PostgreSQL在全球开发者中备受青睐,其向量搜索扩展pgvector也获得了极高的关注。谷歌云在AlloyDB中支持这一特性,利用一种名为分层可导航小世界(HNSW)的先进图形算法进行向量操作。然而,HNSW在处理极大向量工作负载时,其性能可能会下降,导致应用延迟和内存使用增加。

为了解决这些挑战,谷歌云在AlloyDB中引入了ScaNN向量索引。这一创新索引借鉴了谷歌搜索和YouTube的技术,提供高达四倍的向量查询速度和八倍的索引创建速度,同时比标准的PostgreSQL HNSW索引消耗少3-4倍的内存。

谷歌云数据库工程副总裁Andi Gutmans表示:“ScaNN索引是第一个能够扩展支持超过十亿个向量,并提供卓越查询性能的PostgreSQL兼容索引,为任何企业提供高性能工作负载。”他进一步宣布,AlloyDB Omni的下载版本将通过与Aiven的合作作为托管服务提供,支持在本地或云中部署。

“在单一平台上跨云运行事务性、分析性和向量工作负载,轻松构建不同场景下的生成式AI应用程序,”他补充道。

Memorystore for Valkey和Firebase的新增强功能

谷歌云还为Memorystore for Valkey——其Valkey内存数据库的托管集群——以及Firebase应用开发平台推出了升级。Valkey现在将具备向量搜索能力,可以在单位毫秒延迟内对超过十亿个向量进行相似性搜索,达到99%以上的召回率。Memorystore for Valkey的下一个版本8.0目前处于公开预览阶段,与Memorystore for Redis Cluster相比,查询速度提升两倍,并且引入了新的复制方案、网络改进以及增强的性能可视化功能。

对于Firebase,谷歌云即将推出Data Connect,这是一个与Cloud SQL提供的完全托管PostgreSQL数据库集成的后端即服务,预计将在今年晚些时候进入公开预览。

通过这些创新,谷歌云旨在为开发者提供丰富的基础设施和数据库选项,结合强大的语言模型,为组织创建智能应用程序。随着生成式AI应用需求的急剧上升,Omdia预计市场将从2023年的62亿美元增长到2028年的585亿美元,年均增长率达到56%。

Most people like

Find AI tools in YBX