Mejorando Bases de Datos Empresariales: Cómo SuperDuperDB de Código Abierto Integra IA para un Rendimiento Superior

SuperDuperDB, una empresa del portafolio de Intel Ignite ubicada en San Francisco, ha lanzado su versión 0.1 de un marco de código abierto diseñado para simplificar el desarrollo y despliegue de aplicaciones de inteligencia artificial (IA). Este paquete de Python permite a los usuarios integrar de manera fluida la IA —desde modelos de aprendizaje automático (ML) hasta interfaces de programación de aplicaciones (API) de IA preferidas— junto con capacidades de búsqueda vectorial dentro de bases de datos existentes, facilitando la construcción de aplicaciones de IA directamente en estas plataformas.

Con un financiamiento inicial de 1.75 millones de dólares de inversores como Hetz.vc y Session.vc, así como del brazo de capital de riesgo de MongoDB, SuperDuperDB muestra un gran potencial en el panorama de la IA. “El apoyo de MongoDB refleja el potencial transformador de SuperDuperDB. Nuestro objetivo es cerrar la brecha entre el almacenamiento de datos y la IA, facilitando a las organizaciones la construcción y gestión de aplicaciones de IA mediante una relación simbiótica entre datos e IA”, afirmó Timo Hagenow, CEO de SuperDuperDB. El marco ya está disponible en Product Hunt.

Abordando el reto de la IA con SuperDuperDB

A medida que la IA se vuelve integral en las operaciones empresariales modernas, el desarrollo de aplicaciones que aprovechen potentes modelos de ML y datos propietarios se vuelve cada vez más complejo. A pesar de la disponibilidad de numerosos modelos de ML y APIs, los desarrolladores a menudo enfrentan obstáculos significativos para llevar estas tecnologías a producción. La integración de datos de bases de datos primarias en bases de datos vectoriales especializadas suele implicar tuberías complejas y frágiles, lo que conduce a procesos que consumen tiempo y retrasan el lanzamiento de proyectos.

“Las empresas a menudo se enfocan únicamente en simplificar el despliegue de algoritmos en recursos computacionales o en integrar datos y algoritmos a través de tuberías complicadas, comúnmente conocidas como MLOps,” explicó Hagenow. Para optimizar este proceso, Hagenow y su equipo crearon SuperDuperDB, un marco que lleva modelos de IA —incluyendo inferencia en streaming y entrenamiento escalable de modelos— directamente a la base de datos de la empresa.

“SuperDuperDB se puede instalar fácilmente como un paquete de Python, permitiendo a los desarrolladores configurar un despliegue escalable de todos sus modelos y APIs de IA que se comunican directamente con la base de datos. Esto transforma la base de datos en un entorno robusto para el desarrollo y despliegue de IA que se puede implementar en modo experimental, en un solo cliente, o escalar en la nube o de forma local a través de Kubernetes. Ofrece a los desarrolladores un control total de código abierto sobre algoritmos, datos, computo e infraestructura,” agregó Hagenow.

Con este marco, los desarrolladores pueden utilizar diversos modelos de aprendizaje automático para aplicaciones como clasificación, regresión y recomendaciones, además de modelos avanzados de IA generativa para chat basado en LLM y búsquedas vectoriales. La función de búsqueda vectorial puede utilizar funcionalidades in-database de proveedores o las propias capacidades de índice vectorial de SuperDuperDB.

Un Ecosistema de Socios Sólido

A pesar de que el producto aún está en sus primeras etapas, SuperDuperDB ha atraído la atención de actores clave en el ecosistema, proporcionando a los equipos empresariales un soporte integral para bases de datos y modelos populares. El marco soporta diversas plataformas de datos, incluyendo MongoDB, PostgreSQL, MySQL, SQLite y Snowflake, entre otras. En el ámbito de la IA, es compatible con modelos del ecosistema Python, PyTorch, Sklearn y APIs populares de proveedores como OpenAI y Anthropic.

“MongoDB se ha convertido en nuestro socio tecnológico oficial, y hemos realizado seminarios web y sesiones de codificación en vivo con grandes clientes como Cisco. También estamos explorando múltiples POC con Intel y otras pymes,” dijo Hagenow.

Expandiendo el Ecosistema

Hagenow enfatizó que SuperDuperDB busca activamente mejorar su ecosistema mediante colaboraciones con grandes empresas de bases de datos para integraciones más profundas. El objetivo final es lograr una integración fluida con plataformas de datos empresariales, como Databricks y Snowflake. Notablemente, la empresa planea una aplicación nativa para Snowflake que estará disponible en su mercado.

Aplicaciones Potenciales

Si se adopta ampliamente, SuperDuperDB podría simplificar el desarrollo de aplicaciones de IA en diversos sectores. “Combinar la tecnología de SuperDuperDB con MongoDB Atlas Vector Search acelera significativamente el viaje del desarrollador de IA. Este avance permite a industrias, desde la detección de fraudes en finanzas hasta el descubrimiento de fármacos en salud, construir y desplegar rápidamente aplicaciones modernas,” destacó Boris Bialek, CTO de soluciones industriales en MongoDB.

Si bien existen soluciones de IA in-database como MindsDB, generalmente requieren que los desarrolladores se adapten a dialectos SQL. En cambio, SuperDuperDB es prioritaria para Python, alineándose con el lenguaje de programación predominante en la investigación y desarrollo de IA. “SuperDuperDB ofrece una interfaz de Python familiar mientras permite a los expertos acceder a elementos de implementación detallados, como pesos de modelo y especificaciones de entrenamiento. Esto permite a los usuarios trabajar directamente con varios tipos de datos, incluyendo imágenes, video y audio codificados como bytes en Python. Este enfoque único diferencia a SuperDuperDB en el dominio de la IA de código abierto,” concluyó.

Most people like

Find AI tools in YBX