SingleStore Mejora su Base de Datos para Cargas de Trabajo de IA Generativa
SingleStore lanza hoy una nueva versión que refuerza significativamente las capacidades de su plataforma de base de datos para cargas de trabajo de IA generativa, transaccional y analítica.
La base de datos actualizada, SingleStore Pro Max, también conocida como SingleStore 8.5, introduce una avanzada funcionalidad de búsqueda vectorial indexada, permitiendo a las organizaciones construir y soportar de manera efectiva aplicaciones de IA generativa y casos de uso de generación aumentada por recuperación (RAG).
Contexto Histórico de las Capacidades Vectoriales
Esta nueva mejora de búsqueda vectorial indexada no es la primera vez que se presentan capacidades vectoriales en la base de datos de SingleStore. La tecnología ha estado presente desde 2017, cuando la empresa se conocía como MemSQL. Tras el rebranding en 2020, SingleStore ha integrado el Procesamiento Analítico en Línea (OLAP) y el Procesamiento Transaccional en Línea (OLTP) en una plataforma de bases de datos unificada.
Con el aumento de las cargas de trabajo de IA generativa, la demanda de características de bases de datos vectoriales ha crecido. Plataformas nativas como Pinecone han surgido, mientras que proveedores de bases de datos consolidadas, incluyendo DataStax, Neo4j, MongoDB, PostgreSQL y Oracle, han comenzado a incorporar capacidades vectoriales. Según el CEO de SingleStore, Raj Verma, ofrecer únicamente una base de datos vectorial dedicada no es suficiente para las organizaciones, destacando la importancia de integrar las funcionalidades existentes en la base de datos.
Verma afirmó: “Proporcionamos un stack de IA generativa que incluye vectores, permitiéndote construir y modelar aplicaciones de IA generativa. Una base de datos solo con vectores es solo una característica, no una solución a largo plazo, ya que introduce complejidades innecesarias en tu stack de IA.”
Búsqueda Híbrida a Través de Diversos Tipos de Datos
SingleStore cumple un doble propósito como base de datos de Procesamiento Transaccional y Analítico Híbrido (HTAP), capaz de almacenar, procesar y consultar varios tipos de datos. La versión Pro Max mejora las capacidades de búsqueda vectorial tanto para datos estructurados como no estructurados. Aunque SingleStore ha soportado la búsqueda vectorial desde 2017, la última versión incluye algoritmos avanzados como Cuantización de Productos (PQ), Mapa Pequeño Navegable Jerárquico (HNSW) y indexación de Vecinos Más Cercanos Aproximados (ANN) para resultados de búsqueda más rápidos y precisos.
Las capacidades mejoradas de búsqueda vectorial aseguran que las organizaciones puedan aprovechar todos los datos almacenados en SingleStore para búsquedas efectivas y el desarrollo de aplicaciones de IA generativa. Verma enfatizó que, aunque las bases de datos centradas en vectores pueden facilitar la entrada en la IA generativa, a menudo pasan por alto las complejidades del paisaje de datos más amplio de la organización.
“Simplemente agregar vectores no disimulará las complejidades del estado de los datos de una organización,” afirmó.
Verma amplió sobre la visión de SingleStore como una base de datos vectorial integral dentro de un ecosistema de datos simplificado que abarca todos los tipos de datos necesarios. “Solo a través de la simplificación y consolidación de datos, las organizaciones pueden lograr la velocidad y eficiencia necesarias para un próspero patrimonio de datos de IA generativa,” dijo.
Captura de Cambios de Datos Mejorada con Apache Iceberg
En el panorama actual de datos, no es común que las organizaciones centralicen toda su información en una única base de datos. En cambio, las canalizaciones de datos a menudo abarcan múltiples repositorios y aplicaciones. Un método prevalente para ingerir datos de fuentes externas dentro de una base de datos es a través de la Captura de Cambios de Datos (CDC).
SingleStore Pro Max cuenta con capacidades de CDC mejoradas que permiten a los usuarios integrar datos de MySQL, MongoDB y lagos de datos basados en Apache Iceberg en una única base de datos centralizada. Este soporte para Apache Iceberg, un formato de tabla de lago de datos de código abierto popular entre proveedores líderes como IBM y Snowflake, es particularmente significativo. Verma destacó las alianzas continuas de SingleStore con IBM y Snowflake, señalando que el soporte para Iceberg facilitará significativamente los desafíos de integración.
“La capacidad de CDC permite a nuestros clientes agregar datos de diversas fuentes en SingleStore, lo cual es crucial para todo el flujo de trabajo de generación aumentada por recuperación,” dijo Verma.