Cassandra: La Base de Datos Definitiva para la IA Generativa, Según el CEO de DataStax

[Actualizado: 14/12, 9:10 AM]

Chet Kapoor, CEO de DataStax—una empresa de bases de datos en la nube que utiliza Apache Cassandra de código abierto—declaró en la conferencia AI.Dev en Silicon Valley que Cassandra es la “mejor base de datos para la inteligencia artificial generativa”.

Llegada de los Agentes de IA

Kapoor hizo sus comentarios ante una audiencia de 700 personas en el evento de la Fundación Linux, resaltando la competencia feroz entre startups y empresas consolidadas por el liderazgo en el campo de la inteligencia artificial generativa. A medida que las marcas empresariales exploran opciones tecnológicas, la elección de proveedores de bases de datos se vuelve fundamental. Aunque proveedores de modelos de lenguaje grande (LLM) como OpenAI, Anthropic, Google (Gemini) y Meta (Llama) generan mucho interés, la batalla por la supremacía de bases de datos entre las empresas que apoyan aplicaciones de LLM es igualmente intensa.

En su presentación principal, Kapoor destacó varias razones por las cuales la base de datos Cassandra de DataStax se distingue. En particular, es una de las bases de datos operativas más confiables, preferida por las empresas. Muchas organizaciones han desplegado con éxito inteligencia artificial generativa a gran escala utilizando Cassandra, y sus ventajas tecnológicas le permiten superar a rivales como MongoDB y Pinecone.

DataStax también está considerando una oferta pública, y Kapoor parece estar ansioso por generar interés. En junio pasado, la empresa recaudó 115 millones de dólares con una valoración de 1.6 mil millones de dólares. Aunque DataStax no ha revelado detalles financieros, Kapoor señaló que está en el radar de bancos que buscan llevar empresas a la bolsa entre 2024 y 2025.

Puntos Clave de Kapoor:

1. Popularidad y Confiabilidad de Cassandra

Cassandra es una base de datos operativa líder, especialmente mientras compañías como Microsoft y Amazon promueven sus servicios en la nube con bases de datos integradas para inteligencia artificial generativa. Estos gigantes tecnológicos han incentivado a los usuarios a adoptar sus plataformas eliminando barreras, incluidos procesos de migración de datos complejos.

Kapoor criticó humorísticamente a estos proveedores en la nube por complicar excesivamente las soluciones: “Hay uno para ir al baño en la mañana… y luego uno para la tarde, y uno para la noche.” Explicó que la inteligencia artificial generativa ha llevado a los CIO empresariales a buscar bases de datos integradas para realizar consultas sin interrupciones, un área donde Cassandra sobresale. En cambio, las bases de datos de Microsoft y Amazon suelen enfocarse en cargas de trabajo analíticas, lo que puede resultar en ineficiencias costosas en tareas operativas relacionadas con la inteligencia artificial generativa.

DataStax prioriza la rentabilidad y el rendimiento, lo que resulta atractivo para clientes de Fortune 500. Algunos usuarios destacados de Cassandra incluyen a Netflix para metadatos de películas, FedEx para seguimiento de paquetes, Apple para datos de iCloud e iMessage, y Home Depot para operaciones en su sitio web. A medida que las organizaciones desarrollan nuevas aplicaciones de IA, su éxito establecido con Cassandra fomenta una consolidación continua en torno a esta tecnología.

2. Implementaciones Activas de IA Generativa

Kapoor destacó nueve empresas que utilizan la base de datos en la nube Astra DB de DataStax para inteligencia artificial generativa. Mientras muchas empresas experimentan con inteligencia artificial generativa, pocas han avanzado hacia la producción a gran escala, principalmente debido a preocupaciones sobre seguridad y confiabilidad. Se anticipa un cambio en el gasto hacia implementaciones reales el próximo año.

Algunos clientes notables que implementan modelos de lenguaje grande incluyen:

- Physics Wallah: Una plataforma educativa india que alcanza 6 millones de usuarios con un bot versátil impulsado por LLM, desarrollado en solo 55 días.

- Skypoint: Un servicio de atención médica para personas mayores que utiliza un LLM para planificación de tratamientos personalizados, liberando más de 10 horas semanales para los médicos.

Otros incluyen Hey You, Reel Star, Arre, Hornet, Restworld, Sourcetable y Concide. Kapoor mencionó que las pequeñas y medianas empresas pueden adaptarse rápidamente, mientras que las grandes enfrentan más obstáculos regulatorios.

3. Rendimiento Tecnológico Superior

Kapoor enfatizó los avances de DataStax en las capacidades de búsqueda vectorial de Astra, un componente crítico para las bases de datos de inteligencia artificial generativa. La tecnología JVector de Astra ofrece un 16% más de relevancia en comparación con su principal competidor, Pinecone. Esto es esencial para asegurar resultados precisos. Un próximo informe de referencia proporcionará más información, pero los hallazgos preliminares indican que Astra ofrece un procesamiento de transacciones superior en comparación con Pinecone y MongoDB.

Astra DB ofrece acceso de cero latencia a datos vectorizados, desde la indexación hasta la consulta.

Mirando al Futuro: Rápida Adopción de la IA Generativa

Kapoor predijo que la adopción de la inteligencia artificial generativa ocurrirá más rápidamente que en revoluciones tecnológicas anteriores, basándose en marcos existentes como tecnologías web, móviles y en la nube. Anticipa que surgirán casos de uso transformadores que generen ingresos el próximo año, incluyendo funcionalidades avanzadas de LLM que permitan a los agentes de IA realizar tareas complejas. Los ingresos materiales de las integraciones de inteligencia artificial generativa podrían manifestarse tan pronto como el segundo trimestre de 2024, especialmente en sectores como el comercio minorista y los viajes.

Aunque Kapoor y Anuff destacaron las fortalezas de Cassandra, reconocieron que la inteligencia artificial generativa elevará el sector de bases de datos en general. Las demandas de las aplicaciones de IA requieren más recursos de almacenamiento y computación, atrayendo la atención de proveedores de nubes y bases de datos. “Si las aplicaciones de IA se convierten en algo significativo, serán el principal motor de crecimiento tanto para empresas de bases de datos privadas como públicas durante al menos los próximos cinco años,” afirmó Anuff.

Most people like

Find AI tools in YBX