SuperDuperDB aus San Francisco, ein Unternehmen im Intel Ignite Portfolio, hat die Version 0.1 seines Open-Source-Frameworks veröffentlicht, das die Entwicklung und Bereitstellung von KI-Anwendungen vereinfachen soll. Dieses Python-Paket ermöglicht es Nutzern, KI — von Machine Learning (ML)-Modellen bis hin zu bevorzugten KI-APIs — reibungslos mit Vektorsuchfunktionen in bestehenden Datenbanken zu integrieren und somit KI-Anwendungen direkt auf diesen Plattformen zu erstellen.
Unterstützt durch 1,75 Millionen US-Dollar an Anschubfinanzierung von Investoren wie Hetz.vc, Session.vc sowie dem Venture-Capital-Arm von MongoDB, zeigt SuperDuperDB vielversprechende Ansätze im KI-Bereich. „Die Unterstützung von MongoDB spiegelt das transformative Potenzial von SuperDuperDB wider. Unser Ziel ist es, die Lücke zwischen Datenspeicherung und KI zu überbrücken und es Organisationen zu erleichtern, KI-Anwendungen zu entwickeln und zu verwalten, indem wir eine symbiotische Beziehung zwischen Daten und KI fördern“, sagte Timo Hagenow, CEO von SuperDuperDB. Das Framework ist jetzt auf Product Hunt verfügbar.
Die KI-Herausforderung mit SuperDuperDB angehen
Angesichts dessen, dass KI zunehmend in den Betrieb moderner Unternehmen integriert wird, gestaltet sich die Entwicklung von Anwendungen, die leistungsstarke ML-Modelle und proprietäre Daten nutzen, immer komplexer. Trotz der Vielzahl an verfügbaren ML-Modellen und APIs stehen Entwickler häufig vor erheblichen Herausforderungen, diese Technologien produktiv zu nutzen.
Die Integration von Daten aus primären Datenbanken in spezialisierte Vektordatenbanken erfordert oft komplexe und fragile Pipelines, was zeitintensive Prozesse nach sich zieht und die Markteinführung verzögert. „Unternehmen konzentrieren sich oft ausschließlich darauf, die Bereitstellung von Algorithmen auf Rechenressourcen zu vereinfachen oder Daten und Algorithmen durch komplizierte Pipelines zu integrieren, die allgemein als MLOps bezeichnet werden“, erklärte Hagenow.
Um diesen Prozess zu optimieren, hat Hagenow mit seinem Team SuperDuperDB entwickelt, ein Framework, das KI-Modelle — einschließlich Streaming-Inferenz und skalierbarem Modelltraining — direkt in die Datenbank des Unternehmens integriert. „SuperDuperDB lässt sich einfach als Python-Paket installieren und ermöglicht Entwicklern, eine skalierbare Bereitstellung aller ihrer KI-Modelle und APIs einzurichten, die direkt mit der Datenbank kommunizieren. Dies verwandelt die Datenbank in eine leistungsstarke Umgebung für die Entwicklung und Bereitstellung von KI, die im experimentellen Modus, auf einem einzelnen Client oder in der Cloud bzw. vor Ort über Kubernetes skaliert werden kann. Entwickler haben vollständige Open-Source-Kontrolle über Algorithmen, Daten, Rechenleistung und Infrastruktur“, fügte Hagenow hinzu.
Mit diesem Framework können Entwickler verschiedene Machine-Learning-Modelle für Anwendungen wie Klassifikation, Regression und Empfehlungen nutzen sowie fortschrittliche generative KI-Modelle für LLM-basierte Chats und Vektorsuchen. Die Vektorsuche kann entweder die In-Datenbank-Funktionalität von Anbietern oder die eigenen Vektor-Index-Funktionen von SuperDuperDB nutzen.
Ein starkes Partner-Ökosystem
Obwohl sich das Produkt noch in einem frühen Entwicklungsstadium befindet, hat SuperDuperDB bereits Aufmerksamkeit von wichtigen Akteuren im Ökosystem erhalten, die Unternehmen umfassende Unterstützung für gängige Datenbanken und Modelle bieten.
Das Framework unterstützt verschiedene Datenplattformen, einschließlich MongoDB, PostgreSQL, MySQL, SQLite und Snowflake. Auf der KI-Seite werden Modelle aus dem Python-Umfeld, PyTorch, Sklearn und von Anbietern wie OpenAI und Anthropic berücksichtigt. „MongoDB ist unser offizieller Technologiepartner geworden, und wir haben Webinare und Live-Coding-Sitzungen mit großen Kunden wie Cisco durchgeführt. Wir prüfen auch mehrere POCs mit Intel und anderen KMUs“, sagte Hagenow.
Ökosystem erweitern
Hagenow betonte, dass SuperDuperDB aktiv nach Möglichkeiten sucht, sein Ökosystem durch Partnerschaften mit großen Datenbankunternehmen für tiefere Integrationen zu erweitern. Ziel ist es, eine nahtlose Integration mit Unternehmensdatenplattformen wie Databricks und Snowflake zu erreichen. Besonders hervorzuheben ist, dass das Unternehmen eine native App für Snowflake plant, die im Marketplace verfügbar sein wird.
Potenzielle Anwendungen
Wenn SuperDuperDB breit angenommen wird, könnte es die Entwicklung von KI-Anwendungen in verschiedenen Sektoren erheblich vereinfachen. „Die Kombination der Technologie von SuperDuperDB mit MongoDB Atlas Vector Search beschleunigt den Weg der KI-Entwickler erheblich. Dieser Fortschritt ermöglicht es Branchen von der Betrugsbekämpfung im Finanzwesen bis zur Arzneimittelentdeckung im Gesundheitswesen, moderne Anwendungen schnell zu entwickeln und bereitzustellen“, bemerkte Boris Bialek, Field CTO für Industriesolutions bei MongoDB.
Obwohl bereits bestehende In-Datenbank-KI-Lösungen wie MindsDB existieren, erfordern diese oft, dass Entwickler sich an SQL-Dialekte anpassen. Im Gegensatz dazu ist SuperDuperDB Python-first und aligniert sich mit der Programmiersprache, die in der KI-Forschung und -Entwicklung vorherrscht. „SuperDuperDB bietet eine vertraute Python-Oberfläche, während es Experten erlaubt, auf detaillierte Implementierungselemente wie Modellgewichte und Trainingsspezifika zuzugreifen. Es ermöglicht Nutzern, direkt mit verschiedenen Datentypen zu arbeiten, einschließlich Bildern, Videos und Audio, die als Bytes in Python kodiert sind. Dieser einzigartige Ansatz hebt SuperDuperDB im Open-Source-KI-Bereich hervor“, schloss er.