Activeloop Levanta $11 Millones para Mejorar Soluciones de Bases de Datos de IA
Activeloop, una startup con sede en California, ha obtenido $11 millones en financiamiento de Serie A de inversores como Streamlined Ventures, Y Combinator y Samsung Next. Co-fundada por Davit Buniatyan, quien abandonó Princeton, la empresa se especializa en una base de datos dedicada para acelerar el desarrollo de proyectos de inteligencia artificial (IA).
Activeloop se destaca en un mercado de plataformas de datos saturado al abordar un desafío crucial para las empresas: aprovechar datos multimodales no estructurados para entrenar modelos de IA. Su tecnología innovadora, "Deep Lake," permite a los equipos desarrollar aplicaciones de IA a costos hasta un 75% más bajos que soluciones competidoras, aumentando la productividad de ingeniería hasta cinco veces.
Desbloqueando el Potencial de la IA con Deep Lake
A medida que las empresas buscan aprovechar conjuntos de datos complejos para diversas aplicaciones de IA, una investigación de McKinsey subraya el potencial lucrativo de la IA generativa, que podría generar entre $2.6 billones y $4.4 billones en beneficios corporativos anuales a nivel global. Este impacto abarca múltiples áreas, incluidas interacciones con clientes, creación de contenido de marketing y generación de código de software a partir de indicaciones en lenguaje natural.
Cómo Funciona Deep Lake de Activeloop
El entrenamiento de modelos de IA fundamentales de alto rendimiento a menudo implica gestionar datos no estructurados a gran escala, como texto, audio y video. Los métodos tradicionales requieren que los equipos filtren a través de silos de datos desorganizados, lo que conlleva una extensa codificación repetitiva y esfuerzos de integración, elevando los costos del proyecto.
Activeloop aborda esta ineficiencia mediante la estandarización de Deep Lake. Este sistema almacena datos complejos, como imágenes y videos, en representaciones matemáticas nativas de aprendizaje automático (tensores) y permite su recuperación de manera fluida a través de un lenguaje de consulta similar a SQL, visualización en el navegador o integración con marcos de aprendizaje profundo como PyTorch y TensorFlow.
Con Deep Lake, los desarrolladores pueden filtrar y buscar datos multimodales de manera eficiente, realizar un seguimiento de versiones y transmitir datos para entrenar modelos de IA adaptados a aplicaciones específicas.
Transformando la Gestión de Datos en IA
Buniatyan enfatiza que Deep Lake combina las ventajas de un lago de datos convencional mientras convierte todos los datos al formato tensor que requieren los algoritmos de aprendizaje profundo. Los tensores se almacenan en soluciones en la nube o locales, como AWS S3, y se transmiten a GPUs para un entrenamiento eficiente, eliminando los métodos de copia en lotes que anteriormente causaban tiempo de inactividad en las GPUs.
Desde su fundación en 2018, impulsada por los desafíos de Buniatyan en el Laboratorio de Neurociencia de Princeton, Activeloop ha desarrollado funcionalidades de bases de datos integrales con elementos tanto de código abierto como propietarios. El aspecto de código abierto incluye formatos de conjuntos de datos, control de versiones y diversas API para un manejo de datos optimizado. Mientras tanto, las características propietarias ofrecen herramientas avanzadas de visualización y un motor de transmisión robusto.
Aunque los números específicos de clientes no se han divulgado, el proyecto de código abierto se ha descargado más de un millón de veces, consolidando la presencia de Activeloop en mercados empresariales. La oferta empresarial opera bajo un modelo de precios basado en el uso y ya es utilizada por empresas Fortune 500 en sectores regulados como biopharma, ciencias de la vida, tecnología médica, automotriz y legal.
Por ejemplo, Bayer Radiology ha implementado Deep Lake para consolidar diversas modalidades de datos en una única solución, reduciendo significativamente el tiempo de preprocesamiento de datos y presentando una función de "chat con rayos X" que permite a los científicos de datos realizar consultas sobre escaneos utilizando lenguaje natural.
Planes Futuros para el Crecimiento
Activeloop tiene como objetivo mejorar sus soluciones empresariales y atraer más clientes a su base de datos de IA, enfocándose en simplificar la organización y recuperación de datos complejos no estructurados. La empresa planea expandir su equipo de ingeniería, impulsada por la reciente financiación.
Buniatyan también anticipa el próximo lanzamiento de Deep Lake v4, que introducirá un I/O concurrente más rápido, un cargador de datos en streaming avanzado para el entrenamiento de modelos y capacidades completas de linaje de datos, junto con la integración con fuentes de datos externas. Enfatiza que, aunque muchos clientes existen en este espacio, no han surgido competidores directos.
En última instancia, Activeloop aspira a ahorrar a las empresas costos significativos asociados con la organización y recuperación interna de datos, permitiendo que los ingenieros se enfoquen en la productividad en lugar de en tareas repetitivas de codificación.