Activeloop sammelt 11 Millionen Dollar zur Verbesserung von KI-Datenbanklösungen
Das kalifornische Startup Activeloop hat in einer Series-A-Finanzierungsrunde 11 Millionen Dollar von Investoren wie Streamlined Ventures, Y Combinator und Samsung Next erhalten. Das Unternehmen, das von dem Princeton-Abbrecher Davit Buniatyan mitbegründet wurde, ist auf eine spezialisierte Datenbank ausgerichtet, die die Entwicklung von KI-Projekten beschleunigt.
Activeloop hebt sich im überfüllten Markt für Datenplattformen hervor, indem es eine entscheidende Herausforderung für Unternehmen angeht: die Nutzung unstrukturierter multimodaler Daten zur Schulung von KI-Modellen. Die innovative Technologie „Deep Lake“ ermöglicht es Teams, KI-Anwendungen zu entwickeln, deren Kosten bis zu 75 % niedriger sind als bei konkurrierenden Lösungen, während die Produktivität der Ingenieure um das Fünffache gesteigert wird.
Das Potenzial der KI mit Deep Lake erschließen
Angesichts des Interesses der Unternehmen an komplexen Datensätzen für verschiedene KI-Anwendungen zeigt eine McKinsey-Studie das lukrative Potenzial der generativen KI auf, die zwischen 2,6 Billionen und 4,4 Billionen Dollar an globalen Unternehmensgewinnen jährlich generieren könnte. Dieser Einfluss erstreckt sich über verschiedene Bereiche, einschließlich Kundeninteraktionen, Erstellung von Marketinginhalten und Softwarecode-Generierung aus natürlichen Sprachaufforderungen.
Wie Activeloop Deep Lake funktioniert
Die Schulung hochperformanter Basis-KI-Modelle erfordert oft die Verwaltung von unstrukturierten Daten im Petabyte-Bereich aus Text, Audio und Video. Traditionelle Methoden zwingenden Teams, durch unorganisierte Datensilos zu gehen, was umfangreiche Standardcode- und Integrationsaufwände nach sich zieht—und die Projektkosten in die Höhe treibt.
Activeloop begegnet dieser Ineffizienz durch die Standardisierung von Deep Lake. Dieses System speichert komplexe Daten wie Bilder und Videos als für maschinelles Lernen geeignete mathematische Darstellungen (Tensoren) und ermöglicht eine nahtlose Abfrage über eine SQL-ähnliche Tensorabfragesprache, Visualisierungen im Browser oder die Integration mit Deep-Learning-Frameworks wie PyTorch und TensorFlow.
Mit Deep Lake können Entwickler multimodale Daten effizient filtern und durchsuchen, Versionen verfolgen und Datenströme für das Training von KI-Modellen, die auf spezifische Anwendungen zugeschnitten sind, nutzen.
Datenmanagement in der KI transformieren
Buniatyan betont, dass Deep Lake die Vorteile eines herkömmlichen Datenlake vereint, während alle Daten in das Tensorformat umgewandelt werden, das von Deep-Learning-Algorithmen benötigt wird. Tensoren werden in Cloud- oder lokalen Lösungen wie AWS S3 gespeichert und zum effizienten Training an GPUs gestreamt—was die zuvor erforderlichen Batch-Kopiermethoden, die zu Leerlaufzeiten bei GPUs führten, überflüssig macht.
Seit seiner Gründung im Jahr 2018, inspiriert von Buniatyans Herausforderungen im Princeton Neuroscience Lab, hat Activeloop umfassende Datenbankfunktionen mit sowohl Open-Source- als auch proprietären Elementen entwickelt. Der Open-Source-Aspekt umfasst Datensatzformate, Versionskontrolle und verschiedene APIs zur Optimierung der Datenhandhabung. Proprietäre Funktionen bieten hingegen fortschrittliche Visualisierungstools und eine robuste Streaming-Engine.
Obwohl genaue Kundenzahlen nicht offengelegt wurden, wurde das Open-Source-Projekt über eine Million Mal heruntergeladen, was die Präsenz von Activeloop im Unternehmensmarkt stärkt. Das Angebot für Unternehmen basiert auf einem nutzungsabhängigen Preismodell und wird bereits von Fortune-500-Unternehmen in regulierten Sektoren wie Biopharma, Life Sciences, Medtech, Automotive und Recht eingesetzt.
So hat beispielsweise Bayer Radiology Deep Lake implementiert, um verschiedene Datenmodi in einer einzigen Lösung zu konsolidieren, wodurch die Zeit für die Datenvorverarbeitung erheblich reduziert wird. Zudem wurde eine Funktion „Chat mit Röntgenaufnahmen“ eingeführt, die es Datenwissenschaftlern ermöglicht, Scans mit natürlichen Sprachbefehlen abzufragen.
Zukunftspläne für Wachstum
Activeloop hat sich zum Ziel gesetzt, seine Unternehmenslösungen zu verbessern und weitere Kunden für seine KI-Datenbank zu gewinnen, indem es die Organisation und Abfrage komplexer unstrukturierter Daten vereinfacht. Das Unternehmen plant, sein Ingenieurteam mit der kürzlichen Finanzierung zu erweitern.
Buniatyan erwartet auch den baldigen Launch von Deep Lake v4, der eine schnellere parallele E/A, einen fortschrittlichen Streaming-Datenlader für das Modelltraining und umfassende Datenherkunftsfunktionen sowie die Integration mit externen Datenquellen einführen wird. Er hebt hervor, dass es in diesem Bereich viele potenzielle Kunden gibt, aber keine direkten Konkurrenten aufgetaucht sind.
Letztendlich strebt Activeloop an, Unternehmen erhebliche Kosten zu sparen, die mit der internen Datenorganisation und -abfrage verbunden sind, sodass Ingenieure sich auf Produktivität statt auf repetitive Codierungsaufgaben konzentrieren können.