Activeloop Levanta US$ 11 Milhões para Aprimorar Soluções de Banco de Dados com IA
A startup californiana Activeloop garantiu US$ 11 milhões em financiamento da Série A, com investidores como Streamlined Ventures, Y Combinator e Samsung Next. Co-fundada pelo desistente de Princeton, Davit Buniatyan, a empresa se especializa em um banco de dados dedicado para acelerar o desenvolvimento de projetos de IA.
A Activeloop se destaca em um mercado competitivo de plataformas de dados ao resolver um desafio crítico para as empresas: a utilização de dados multimodais não estruturados para treinar modelos de IA. Sua tecnologia inovadora, "Deep Lake", permite que equipes desenvolvam aplicações de IA com custos até 75% inferiores às soluções concorrentes, enquanto aumentam a produtividade da engenharia em até cinco vezes.
Desbloqueando o Potencial da IA com Deep Lake
À medida que as empresas buscam aproveitar conjuntos de dados complexos para diversas aplicações de IA, uma pesquisa da McKinsey destaca o potencial lucrativo da IA generativa, que pode gerar entre US$ 2,6 trilhões e US$ 4,4 trilhões em lucros corporativos anuais globalmente. Este impacto abrange diversas áreas, como interações com clientes, criação de conteúdo de marketing e geração de código de software a partir de prompts em linguagem natural.
Como Funciona o Deep Lake da Activeloop
O treinamento de modelos de IA de alta performance frequentemente envolve o gerenciamento de dados não estruturados em escala de petabytes, abrangendo texto, áudio e vídeo. Os métodos tradicionais exigem que as equipes se debrucem sobre silos de dados desorganizados, necessitando de extensa codificação e esforços de integração—escalando os custos do projeto.
A Activeloop aborda essa ineficiência através da padronização do Deep Lake. Este sistema armazena dados complexos, como imagens e vídeos, em representações matemáticas nativas de aprendizado de máquina (tensores) e permite a recuperação sem esforço via uma linguagem de consulta tipo SQL, visualização no navegador ou integração com frameworks de deep learning como PyTorch e TensorFlow.
Com o Deep Lake, os desenvolvedores podem filtrar e buscar dados multimodais de forma eficiente, rastrear versões e transmitir dados para o treinamento de modelos de IA personalizados.
Transformando a Gestão de Dados em IA
Buniatyan enfatiza que o Deep Lake combina as vantagens de um data lake tradicional, convertendo todos os dados em formato tensor, o qual é necessário para algoritmos de deep learning. Os tensores são armazenados em soluções em nuvem ou locais, como AWS S3, e transmitidos para GPUs para treinamento eficiente—eliminando métodos de cópia em lote que anteriormente causavam tempo ocioso nas GPUs.
Desde sua fundação em 2018, impulsionada pelos desafios de Buniatyan no Princeton Neuroscience Lab, a Activeloop desenvolveu funcionalidades abrangentes de banco de dados, com elementos tanto de código aberto quanto proprietários. O aspecto de código aberto inclui formatos de conjuntos de dados, controle de versão e várias APIs para manejo de dados simplificado. Enquanto isso, as funcionalidades proprietárias oferecem ferramentas de visualização avançadas e um robusto mecanismo de streaming.
Embora o número específico de clientes permaneça não divulgado, o projeto de código aberto já foi baixado mais de um milhão de vezes, fortalecendo a presença da Activeloop nos mercados empresariais. A oferta para empresas opera com um modelo de preços baseado em uso e já é utilizada por empresas da Fortune 500 em setores regulados como biopharma, ciências da vida, medtech, automotivo e jurídico.
Por exemplo, a Bayer Radiology implementou o Deep Lake para consolidar várias modalidades de dados em uma única solução, reduzindo significativamente o tempo de pré-processamento de dados e introduzindo um recurso "converse com raios X" que permite aos cientistas de dados consultar exames usando linguagem natural.
Planos Futuros de Crescimento
A Activeloop pretende aprimorar suas soluções empresariais e atrair novos clientes para seu banco de dados de IA, focando na simplificação da organização e recuperação de dados complexos não estruturados. A empresa planeja expandir sua equipe de engenharia, alimentada pelo recente financiamento.
Buniatyan também antecipa o lançamento do Deep Lake v4, que apresentará I/O concorrente mais rápido, um carregador de dados em streaming avançado para treinamento de modelos e capacidades abrangentes de rastreamento de dados, além de integração com fontes de dados externas. Ele enfatiza que, enquanto muitos clientes existem nesse espaço, nenhum concorrente direto surgiu.
Em última análise, a Activeloop aspira economizar custos substanciais para as empresas associados à organização e recuperação de dados internos, permitindo que os engenheiros se concentrem na produtividade em vez de tarefas repetitivas de codificação.