SingleStore增强生成性AI工作负载的数据库能力
SingleStore今天推出了一个新版本,显著提升了其数据库平台在生成性AI、事务和分析工作负载方面的能力。此次更新的SingleStore Pro Max数据库,亦称为SingleStore 8.5,引入了先进的索引向量搜索功能,使组织能够有效构建和支持生成性AI应用及检索增强生成(RAG)用例。
向量功能的历史背景
此次增强的索引向量搜索并非SingleStore数据库首次引入向量功能。该技术自2017年公司以MemSQL品牌运营时就已存在。2020年更名后,SingleStore将在线分析处理(OLAP)与在线事务处理(OLTP)整合为统一的数据库平台。
随着生成性AI工作负载的兴起,向量数据库功能的需求骤增。像Pinecone这样的原生平台相继出现,而包括DataStax、Neo4j、MongoDB、PostgreSQL和Oracle在内的成熟数据库供应商也开始整合向量功能。SingleStore首席执行官Raj Verma指出,仅提供专用向量数据库对组织而言是不够的,强调了整合现有数据库功能的重要性。他表示:“我们提供的生成性AI解决方案包括向量功能,使您能够构建和建模生成性AI应用。仅仅依赖向量数据库不过是一种临时功能,而非长远解决方案,因为这会给您的AI架构引入不必要的复杂性。”
跨多种数据类型的混合搜索
SingleStore作为混合事务和分析处理(HTAP)数据库,能高效存储、处理和查询各种数据类型。Pro Max版本强化了针对结构化和非结构化数据的向量搜索能力。尽管SingleStore自2017年起就支持向量搜索,但最新版本引入了更先进的算法,诸如产品量化(PQ)、分层可导航小世界(HNSW)和近似最近邻(ANN)索引,以实现更快更精确的搜索结果。
增强的向量搜索能力确保组织可以高效利用存储在SingleStore中的所有数据,支持生成性AI应用的开发。Verma强调,尽管专注于向量的数据库可能简化生成性AI的入门,但常常忽视了组织更广泛数据环境的复杂性。他说:“单靠增加向量并不能掩盖企业数据状态中的复杂性。”
Verma进一步阐述了SingleStore作为一个全面的向量数据库在简化数据生态系统中的愿景,涵盖所有必要的数据类型。他指出:“只有通过简化和数据整合,组织才能实现生成性AI数据环境所需的速度和效率。”
与Apache Iceberg的增强变更数据捕获
在当今数据环境中,企业很少将所有数据集中在单一数据库中。数据管道通常跨多个存储库和应用。常见的数据接入方法是通过变更数据捕获(CDC)从外部源导入数据。
SingleStore Pro Max提供了增强的CDC功能,使用户能够将MySQL、MongoDB和基于Apache Iceberg的数据湖中的数据整合到一个集中数据库中。支持Apache Iceberg——这一广泛应用于顶尖供应商如IBM和Snowflake的开源数据湖表格式,具有重大意义。Verma强调了SingleStore与IBM和Snowflake持续的合作关系,指出对Iceberg的支持将显著简化集成难题。
Verma表示:“CDC能力使我们的客户能够将来自不同来源的数据聚合到SingleStore中,这对整个检索增强生成工作流至关重要。”