Daten sind das Fundament der KI-Innovation. Unternehmen, von agilen Start-ups bis hin zu multinationalen Konzernen, investieren Milliarden, um Datensätze für leistungsstarke KI-Anwendungen zu nutzen.
Dennoch bleibt der Zugang zu und die Nutzung von Daten aus verschiedenen Quellen und Modalitäten – wie Text, Video und Audio – trotz dieser erheblichen Investitionen eine komplexe Herausforderung. Teams sehen sich zahlreichen Integrationsproblemen gegenüber, was zu Verzögerungen und verpassten Geschäftsmöglichkeiten führt.
ApertureData, ein Start-up aus Kalifornien, möchte diese Herausforderung mit seiner einheitlichen Datenebene, ApertureDB, angehen. Diese innovative Lösung kombiniert die Stärken von Graph- und Vektordatenbanken mit einem multimodalen Datenmanagement und ermöglicht so KI- und Datenteams eine schnellere Anwendungsentwicklung. Kürzlich gab ApertureData eine Seed-Finanzierung in Höhe von 8,25 Millionen US-Dollar und die Einführung einer cloud-nativen Version ihrer Graph-Vektor-Datenbank bekannt.
„ApertureDB kann die Zeiten für Dateninfrastruktur und Datensatzvorbereitung um 6 bis 12 Monate reduzieren, was enormen Wert für CTOs und CDOs schafft, die in einem sich schnell ändernden Umfeld effektive KI-Strategien entwickeln müssen“, sagte Vishakha Gupta, Gründerin und CEO von ApertureData. Sie betonte, dass dieses Angebot die Produktivität von Data-Science- und Machine-Learning-Teams im Durchschnitt verzehnfachen kann, insbesondere bei der Entwicklung multimodaler KI.
Was macht ApertureData besonders attraktiv?
Viele Organisationen haben Schwierigkeiten, den zunehmenden Zustrom multimodaler Daten – Terabytes von Text, Bildern, Audio und Video – zu verwalten, was ihre Fähigkeit einschränkt, KI effektiv zu nutzen. Die Herausforderung liegt nicht in einem Mangel an Daten, sondern im fragmentierten Ökosystem der erforderlichen Tools, um diese für fortschrittliche KI-Anwendungen zu verarbeiten.
Aktuell müssen Teams Daten aus verschiedenen Quellen zusammenstellen, sie in Cloud-Speichern ablegen und ständig wechselnde Metadaten in Dateien oder Datenbanken verwalten. Dieser Prozess erfordert häufig das Schreiben von benutzerdefinierten Skripten für die Datenabfrage und -vorverarbeitung. Nach den ersten Aufgaben müssen Teams Graphdatenbanken und Vektorsuchfunktionen integrieren, um die gewünschten KI-Erfahrungen umzusetzen, was zu erheblichen Verzögerungen führt.
„Unternehmen erwarten, dass ihre Datenebene die Verwaltung unterschiedlicher Datenmodalitäten erleichtert, die ML-Vorbereitung optimiert und das Management von Datensätzen, Annotationen, Modellverfolgung sowie fortgeschrittene Datensuche und -visualisierung unterstützt. Leider greifen sie oft auf manuell integrierte Lösungen zurück, die verschiedene Cloud-Speichersysteme, Datenbanken und Verarbeitungsbibliotheken umfassen, was den Workflow kompliziert und den Projektzeitrahmen verlängert“, erklärte Gupta, die diese Problematik während ihrer Arbeit mit Vision-Daten bei Intel erkannte.
Um dies zu lösen, arbeitete Gupta mit Luis Remis, ebenfalls Forschungswissenschaftler bei Intel Labs, zusammen, um eine umfassende Datenebene zu schaffen, die alle Aufgaben der multimodalen KI-Datenverwaltung auf einer Plattform vereint.
ApertureDB ermöglicht es Unternehmen jetzt, Datensätze – große Bilder, Videos, Dokumente, Einbettungen und deren Metadaten – zentral zu speichern, um eine effiziente Abfrage und Retrieval zu gewährleisten. Es bietet eine einheitliche Sicht auf das Schema und beinhaltet Wissensgraphen sowie Vektorsuchmöglichkeiten für unterschiedliche KI-Anwendungen, von Chatbots bis hin zu Suchsystemen.
„Durch umfassende Gespräche haben wir den Bedarf an einer Datenbank verstanden, die sowohl multimodales Datenmanagement als auch KI-Anforderungen umfassend berücksichtigt und damit die Einführung und den Produktionsbetrieb mühelos gestaltet. Das haben wir mit ApertureDB erreicht“, bemerkte Gupta.
Wie schneidet ApertureDB im Vergleich zu bestehenden Lösungen ab?
Während viele auf KI ausgerichtete Datenbanken verfügbar sind, strebt ApertureData danach, sich eine Nische zu schaffen, indem es ein einheitliches Produkt anbietet, das multimodale Daten nativ verarbeitet und Wissensgraphen nahtlos mit schneller multimodaler Vektorsuche für KI-Anwendungen integriert. Benutzer können leicht Beziehungen zwischen Datensätzen erkunden und bevorzugte KI-Frameworks für spezifische Anwendungen nutzen.
„Unser primärer Wettbewerb sind interne Datenplattformen, die auf einer Mischung aus Werkzeugen wie relationalen oder Graphdatenbanken, Cloud-Speichern und internen Skripten basieren. Typischerweise ersetzen wir Lösungen wie Postgres, Weaviate, Qdrant, Milvus, Pinecone, MongoDB oder Neo4j, insbesondere im Kontext multimodaler und generativer KI“, betonte Gupta.
ApertureData behauptet, dass seine Datenbank die Produktivität von Data-Science- und KI-Teams im Durchschnitt um das Zehnfache steigern kann. Sie soll multimodale Datensätze bis zu 35-mal schneller mobilisieren als traditionelle Lösungen und bietet eine Vektorsuche sowie Klassifizierungsleistungen, die 2 bis 4-mal schneller sind als bestehende Open-Source-Vektordatenbanken.
Obwohl Gupta keine spezifischen Kundennamen nannte, bemerkte sie, dass sie Implementierungen mit ausgewählten Fortune-100-Unternehmen, darunter ein führender Einzelhändler für Wohnmöbel, ein großer Hersteller und verschiedene Biotech- sowie aufstrebende generative KI-Start-ups, etabliert haben.
„In unseren Implementierungen hebt das Feedback der Kunden signifikante Gewinne in Produktivität, Skalierbarkeit und Leistung hervor“, fügte sie hinzu und merkte an, dass das Unternehmen einem Kunden 2 Millionen US-Dollar an Einsparungen verschafft hat.
Für die Zukunft plant ApertureData, seine Cloud-Plattform zu erweitern, um neue Klassen von KI-Anwendungen zu unterstützen, die Integration von Ökosystemen für ein nahtloses Benutzererlebnis zu verbessern und Partnerschaften für eine breitere Implementierung auszubauen.