Los datos son la piedra angular de la innovación en inteligencia artificial (IA). Organizaciones, desde startups ágiles hasta corporaciones multinacionales, están invirtiendo miles de millones para aprovechar conjuntos de datos y desarrollar aplicaciones de IA de alto rendimiento.
Sin embargo, a pesar de estas inversiones significativas, el acceso y la utilización de datos provenientes de diversas fuentes y modalidades—como texto, video y audio—sigue siendo un desafío complejo. Los equipos enfrentan numerosos obstáculos de integración, lo que causa retrasos y oportunidades comerciales perdidas.
ApertureData, una startup con sede en California, busca resolver este problema con su capa de datos unificada, ApertureDB. Esta solución innovadora combina las fortalezas de bases de datos gráficas y vectoriales junto con la gestión de datos multimodales, permitiendo que equipos de IA y de datos aceleren la implementación de sus aplicaciones. Recientemente, ApertureData anunció una financiación inicial de $8.25 millones y el lanzamiento de una versión nativa en la nube de su base de datos gráfica-vectorial.
“ApertureDB puede reducir los tiempos de infraestructura de datos y preparación de conjuntos de datos entre 6 y 12 meses, lo que proporciona un gran valor a los CTOs y CDOs que deben desarrollar estrategias efectivas de IA en un entorno que cambia rápidamente y tiene requisitos de datos conflictingos”, dijo Vishakha Gupta, fundadora y CEO de ApertureData. Ella enfatizó que esta oferta puede aumentar la productividad de los equipos de ciencia de datos y aprendizaje automático en un promedio de diez veces en el desarrollo de IA multimodal.
¿Qué hace destacar a ApertureData?
Muchas organizaciones enfrentan dificultades para gestionar el creciente volumen de datos multimodales—terabytes de texto, imágenes, audio y video—lo que obstaculiza su capacidad para aprovechar la IA de manera efectiva. El desafío no radica en la escasez de datos, sino en el ecosistema de herramientas fragmentado necesario para procesarlos para aplicaciones avanzadas de IA.
Actualmente, los equipos deben recopilar datos de diversas fuentes, almacenarlos en repositorios en la nube y lidiar con metadata que cambia continuamente en archivos o bases de datos. Este proceso a menudo requiere la elaboración de scripts personalizados para la recuperación y preprocesamiento de datos. Una vez completadas las tareas iniciales, los equipos deben integrar bases de datos gráficas y funciones de búsqueda vectorial para implementar las experiencias de IA deseadas, lo que provoca retrasos significativos.
“Las empresas esperan que su capa de datos facilite la gestión de diversas modalidades de datos, agilice la preparación del aprendizaje automático y apoye la gestión de conjuntos de datos, anotaciones, seguimiento de modelos y búsqueda y visualización de datos avanzadas. Desafortunadamente, a menudo recurren a soluciones integradas manualmente que implican diversos sistemas de almacenamiento en la nube, bases de datos y bibliotecas de procesamiento, complicando el flujo de trabajo y retrasando los plazos de los proyectos,” explicó Gupta, quien reconoció este problema mientras trabajaba con datos visuales en Intel.
Para abordar esto, Gupta se asoció con Luis Remis, también científico investigador en Intel Labs, para crear una capa de datos integral que aborde todas las tareas de datos de IA multimodal en una sola plataforma. ApertureDB ahora permite a las empresas centralizar conjuntos de datos—imágenes grandes, videos, documentos, incrustaciones y su metadata—para una recuperación y consulta eficientes. Ofrece una vista unificada del esquema e incluye capacidades de búsqueda de gráficos de conocimiento y vectorial para diversas aplicaciones de IA, desde chatbots hasta sistemas de búsqueda.
“A través de extensas conversaciones, aprendimos sobre la necesidad de una base de datos que comprenda de manera integral tanto la gestión de datos multimodales como los requisitos de IA, haciendo que la adopción y la implementación en producción sean sin esfuerzo. Eso es exactamente lo que hemos logrado con ApertureDB,” comentó Gupta.
¿Cómo se compara ApertureDB con soluciones existentes?
Si bien existen muchas bases de datos centradas en IA, ApertureData busca establecer un nicho ofreciendo un producto unificado que maneje nativamente datos multimodales e integre de manera fluida gráficos de conocimiento con una búsqueda rápida vectorial para aplicaciones de IA. Los usuarios pueden explorar fácilmente las relaciones entre conjuntos de datos y utilizar marcos de IA preferidos para aplicaciones específicas.
“Nuestra competencia principal son plataformas de datos internas que dependen de una mezcla de herramientas, como bases de datos relacionales o gráficas, almacenamiento en la nube y scripts internos. Típicamente, reemplazamos soluciones como Postgres, Weaviate, Qdrant, Milvus, Pinecone, MongoDB o Neo4j, particularmente en contextos de IA multimodal y generativa,” enfatizó Gupta.
ApertureData afirma que su base de datos puede aumentar la productividad de los equipos de ciencia de datos y IA en un promedio de 10 veces. Se informa que moviliza conjuntos de datos multimodales hasta 35 veces más rápido que las soluciones tradicionales y ofrece rendimiento de búsqueda vectorial y clasificación que es de 2 a 4 veces más rápido que las bases de datos de vectores de código abierto existentes.
Aunque Gupta no reveló identidades específicas de clientes, señaló que han establecido implementaciones con selectas empresas de Fortune 100, incluido un destacado minorista de muebles para el hogar, un gran fabricante y varias startups de biotecnología e IA generativa emergente.
“A través de nuestras implementaciones, el feedback de los clientes resalta ganancias significativas en productividad, escalabilidad y rendimiento,” añadió, señalando que la empresa ha ahorrado a un cliente $2 millones.
De cara al futuro, ApertureData planea expandir su plataforma en la nube para acomodar nuevas clases de aplicaciones de IA, mejorar las integraciones en el ecosistema para una experiencia de usuario fluida y ampliar asociaciones para implementaciones más amplias.