DataStax simplifica el desarrollo de aplicaciones de Inteligencia Artificial Generativa RAG con su innovadora API de datos.

DataStax Mejora el Desarrollo de IA Generativa con Nuevo API de Datos

DataStax ha lanzado un nuevo API de datos diseñado para simplificar la creación de aplicaciones de generación aumentada de recuperación (RAG) para desarrolladores. Como líder en el mercado del sistema de base de datos de código abierto Apache Cassandra, DataStax impulsa su servicio de base de datos en la nube AstraDB con esta tecnología. En 2023, añadieron capacidades de bases de datos vectoriales a su plataforma, posicionándose junto a los principales actores del sector. En un evento reciente, el CEO de DataStax se refirió a Cassandra como “la mejor base de datos para IA generativa”.

Desbloqueando el Potencial de las Bases de Datos Vectoriales

Las capacidades de bases de datos vectoriales son fundamentales para las aplicaciones RAG, que utilizan modelos de lenguaje grandes (LLMs) y plataformas de datos para generar salidas precisas y personalizadas. DataStax ha ofrecido capacidades vectoriales en AstraDB desde julio de 2023; sin embargo, los usuarios aún necesitaban dominar el Lenguaje de Consulta de Cassandra (CQL) para realizar llamadas a los datos. El nuevo API de datos cambia esta dinámica, permitiendo a los desarrolladores utilizar Python y JavaScript para interactuar con la base de datos. Esto actualiza el panorama competitivo, acercando a DataStax a bases de datos vectoriales específicas como Pinecone, que recientemente introdujo funcionalidad sin servidor.

“Ha existido una lucha entre bases de datos vectoriales nativas que solo admiten consultas vectoriales y bases de datos híbridas que sobresalen en la modelación de consultas,” comentó Ed Anuff, Director de Producto en DataStax. “Nuestro objetivo era cerrar esa brecha, y eso es precisamente lo que logra el API de datos.”

Transformando el Desarrollo de Aplicaciones RAG

Aunque el nuevo API no introduce nuevas capacidades vectoriales en AstraDB, optimiza el proceso de desarrollo. Anuff señaló que desde el lanzamiento de las capacidades vectoriales, alrededor de la mitad de los nuevos usuarios de AstraDB se han centrado en aplicaciones de IA generativa. El reto era que estos desarrolladores dependían principalmente de Python y JavaScript, que no eran compatibles directamente para acceder a los datos de AstraDB.

Antes del lanzamiento del API, crear aplicaciones de IA requería un amplio conocimiento de CQL, lo que implicaba modelado de datos complejo que no favorecía el desarrollo sencillo de aplicaciones RAG. Además, las consultas no estaban optimizadas para la recuperación de datos vectoriales.

El nuevo API de datos resuelve estos problemas al gestionar automáticamente la vectorización, ofreciendo una interfaz amigable en Python y JavaScript, y mejorando el rendimiento mediante un almacenamiento y una indexación eficientes de datos vectoriales a nivel de base de datos. Esto reduce la curva de aprendizaje y mejora el rendimiento en comparación con el uso de APIs existentes de Cassandra.

Modernizando la Interacción con Bases de Datos

Los APIs de bases de datos tradicionales a menudo traducen lenguajes de programación como Python o JavaScript al lenguaje de consulta de una base de datos, una práctica similar a los antiguos métodos de Mapeo Objeto-Relacional (ORM). El API de datos de DataStax se distingue gracias a la arquitectura única de Cassandra, que facilita conexiones más profundas dentro de la base de datos, resultando en un mejor rendimiento de consultas.

“El API de datos presenta a los desarrolladores un formato de datos simple basado en JSON. Cualquier cosa expresable en JSON puede ser enviada y recuperada de la base de datos,” explicó Anuff. “Almacenamos esto de manera eficiente en Cassandra, manteniendo un rendimiento óptimo.”

Mejorando la Búsqueda Vectorial con JVector

Un componente clave de los avances de DataStax en bases de datos vectoriales es el motor de búsqueda JVector, una herramienta de código abierto integrada en AstraDB. Anuff destacó que JVector utiliza DiskANN, una versión optimizada para disco del algoritmo de búsqueda de vecinos más cercanos aproximados (ANN). Esta estrategia mejora significativamente el rendimiento de recuperación, especialmente a gran escala.

DataStax afirma que el motor JVector permite a AstraDB ofrecer una relevancia y recuperación superiores en comparación con otras bases de datos vectoriales. Gran parte del desarrollo vectorial continuo de DataStax, incluido JVector y el nuevo API de datos, se está liberando como código abierto para la comunidad de Cassandra y los clientes de AstraDB.

“Estamos firmemente comprometidos a proporcionar recursos a los ecosistemas de código abierto,” afirmó Anuff. “Nuestro objetivo es garantizar que los desarrolladores tengan el camino más sencillo al elegir un servicio en la nube.”

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles