A medida que la inteligencia artificial generativa avanza, las empresas pueden descubrir que los chatbots básicos ya no son suficientes. Los proveedores de nubes a gran escala están mejorando rápidamente sus bases de datos y herramientas para permitir un despliegue rápido y eficiente de datos operativos, empoderando a las organizaciones para crear aplicaciones inteligentes y con contexto.
Un ejemplo destacado son las actualizaciones recientes de Google Cloud en sus ofertas de bases de datos, comenzando con AlloyDB. En una entrada de blog reciente, Google anunció la disponibilidad general del índice vectorial ScaNN (nearest neighbor escalable) en su base de datos completamente gestionada, compatible con PostgreSQL. Esta tecnología, que respalda Google Search y YouTube, facilita la creación más rápida de índices y consultas vectoriales, mientras reduce significativamente el consumo de memoria.
Además, Google se ha asociado con Aiven para ofrecer un despliegue gestionado de AlloyDB y ha presentado mejoras para Memorystore para Valkey y Firebase.
Entendiendo el Valor de ScaNN para AlloyDB
Las bases de datos vectoriales son fundamentales para impulsar cargas de trabajo avanzadas de IA, desde chatbots RAG hasta sistemas de recomendación. Son ideales para almacenar y gestionar incrustaciones vectoriales (representaciones de datos numéricos) y realizar búsquedas de similitud cruciales para aplicaciones específicas. Con PostgreSQL siendo la base de datos preferida entre desarrolladores a nivel mundial, su extensión de búsqueda vectorial, pgvector, ha ganado una popularidad inmensa. Google Cloud admite esta característica en AlloyDB, utilizando un algoritmo basado en grafos de vanguardia llamado HNSW (Hierarchical Navigable Small World) para operaciones vectoriales. Sin embargo, el rendimiento de HNSW puede degradarse con cargas de trabajo de vectores excepcionalmente grandes, lo que resulta en latencias en las aplicaciones y un mayor uso de memoria.
Para superar estos desafíos, Google Cloud ha hecho disponible el índice vectorial ScaNN en AlloyDB. Este índice innovador utiliza la misma tecnología que Google Search y YouTube, ofreciendo hasta cuatro veces más rapidez en consultas vectoriales y ocho veces en la creación de índices, mientras consume de 3 a 4 veces menos memoria que el índice HNSW estándar en PostgreSQL.
“El índice ScaNN es el primer índice compatible con PostgreSQL que puede escalar para soportar más de mil millones de vectores, brindando un desempeño excepcional en consultas y habilitando cargas de trabajo de alto rendimiento para cualquier empresa,” afirmó Andi Gutmans, GM y VP de Ingeniería de Bases de Datos en Google Cloud. Gutmans también anunció que AlloyDB Omni, la versión descargable de AlloyDB, estará disponible como un servicio gestionado a través de una asociación con Aiven, permitiendo su despliegue en cualquier entorno, ya sea en las instalaciones o en la nube. “Ejecuta cargas de trabajo transaccionales, analíticas y vectoriales en la nube en una única plataforma, creando fácilmente aplicaciones de IA generativa donde sea necesario,” continuó.
Mejoras para Memorystore para Valkey y Firebase
Además, Google Cloud presentó mejoras para Memorystore para Valkey, su clúster gestionado de la base de datos en memoria Valkey, y para la plataforma de desarrollo de aplicaciones Firebase. Valkey incluirá ahora capacidades de búsqueda vectorial, permitiendo que una sola instancia realice búsquedas de similitud con latencias de un solo dígito milisegundos en más de mil millones de vectores, logrando más del 99% de recuperación. La próxima versión, Memorystore para Valkey 8.0, está actualmente en vista pública y presenta consultas dos veces más rápidas en comparación con Memorystore para Redis Cluster, junto con nuevos esquemas de replicación, mejoras en redes y mayor visibilidad del rendimiento.
Para Firebase, Google Cloud está listo para presentar Data Connect, un backend como servicio integrado con una base de datos PostgreSQL completamente gestionada alimentada por Cloud SQL, que entrará en vista pública más adelante este año.
Con estas innovaciones, Google Cloud busca proporcionar a los desarrolladores una amplia gama de opciones de infraestructura y bases de datos, junto con potentes modelos de lenguaje, para crear aplicaciones inteligentes para sus organizaciones. A medida que la demanda de aplicaciones de IA generativa se proyecta a aumentar drásticamente, Omdia estima que el mercado se expandirá de 6.2 mil millones de dólares en 2023 a 58.5 mil millones de dólares en 2028, representando una tasa compuesta de crecimiento (CAGR) del 56%.