Während Vektor-Datenbanken in den Enterprise-AI-Implementierungen für Retrieval Augmented Generation (RAG) zunehmend wichtig werden, liegt die wahre Herausforderung im effektiven Management unstrukturierter Daten. Chris Latimer, Mitbegründer und CEO von Vectorize, leitete zuvor Cloud-Initiativen bei DataStax. Er stellte ein häufiges Problem fest: Die Vektor-Datenbank selbst war nicht das Hauptproblem bei der Umsetzung von Unternehmens-RAG. Vielmehr bestand die Schwierigkeit darin, die Aufnahme unstrukturierter Daten in die Vektor-Datenbank zu optimieren, um generative KI zu nutzen.
Um diesem Problem zu begegnen, gründete Latimer vor zehn Monaten Vectorize. Das Unternehmen hat nun eine Finanzierungsrunde in Höhe von 3,6 Millionen US-Dollar unter der Leitung von True Ventures sowie die allgemeine Verfügbarkeit seiner Enterprise-RAG-Plattform bekannt gegeben. Diese Plattform erleichtert einen agentischen RAG-Ansatz und ermöglicht nahezu zeitnahe Datenverarbeitung. Vectorize konzentriert sich auf Datenengineering und unterstützt Organisationen dabei, ihre Daten für Vektor-Datenbanken und große Sprachmodelle (LLMs) vorzubereiten und zu verwalten. Darüber hinaus können Unternehmen über eine intuitive Benutzeroberfläche schnell eine RAG-Datenpipeline aufbauen und nutzen ein RAG-Bewertungstool, um verschiedene Strategien zu testen.
„Wir haben festgestellt, dass die Ergebnisse in den letzten Phasen von Gen-AI-Projekten oft unzureichend waren“, bemerkte Latimer in einem exklusiven Interview. „Der Context, der der Vektor-Datenbank bereitgestellt wurde, war für das große Sprachmodell nicht hilfreich, was zu Halluzinationen und Fehlinterpretationen der Daten führte.“
Wie Vectorize in den Enterprise-RAG-Stack integriert wird
Vectorize ist keine Vektor-Datenbank, sondern eine Plattform, die unstrukturierte Datenquellen mit bestehenden Vektor-Datenbanken wie Pinecone, DataStax, Couchbase und Elastic verbindet. Sie nimmt Daten aus verschiedenen Quellen auf und optimiert sie, um eine produktionstaugliche Datenpipeline zu gewährleisten, die Aufnahme, Synchronisation, Fehlerbehandlung und bewährte Verfahren im Datenengineering umfasst.
Zudem ist Vectorize keine Technologie zur Vektor-Einbettung. Vielmehr unterstützt es die Benutzer dabei, verschiedene Einbettungsmodelle und Datenchunking-Methoden zu bewerten, um die optimale Konfiguration für ihre spezifischen Anwendungsfälle zu finden. Latimer hob die Flexibilität der Plattform hervor, die es den Nutzern ermöglicht, aus zahlreichen Einbettungsmodellen zu wählen, einschließlich OpenAIs Ada und den Voyage AI-Einbettungen, die von Snowflake verwendet werden.
„Wir konzentrieren uns auf innovative Daten-Vektorierungsstrategien, um die besten Ergebnisse zu erzielen“, sagte Latimer und betonte, dass die Plattform eine produktionstaugliche Lösung bietet, die Bedenken hinsichtlich des Datenengineerings zerstreut.
Einsatz von agentischer KI für Enterprise RAG
Ein herausragendes Merkmal von Vectorize ist der „agentische RAG“-Ansatz, der traditionelle RAG-Methoden mit KI-Agentenfähigkeiten kombiniert und autonomes Problem-solving fördert. Groq, ein früher Nutzer und Startup für KI-Inferenz-Silizium, das kürzlich 640 Millionen US-Dollar eingeworben hat, nutzt die agentischen RAG-Fähigkeiten von Vectorize, um einen KI-unterstützenden Agenten zu verbessern. Dieser Agent kann Kund*innenanfragen autonom lösen, indem er Daten und Kontext aus den Pipelines von Vectorize verwendet.
Latimer erklärte: „Wenn ein Kunde eine wiederkehrende Frage stellt, sollte der Agent effizient das Problem lösen, ohne menschliches Eingreifen. Tritt jedoch ein komplexeres Problem auf, sollte er an einen Menschen eskalieren, was das Wesen einer KI-Agentenarchitektur verkörpert.“
Die Bedeutung von Echtzeit-Datenpipelines im Enterprise RAG
Für Unternehmen besteht ein wesentlicher Vorteil bei der Nutzung von RAG darin, auf aktuelle Daten zugreifen zu können. „Veraltete Daten führen zu schlechten Entscheidungen“, warnte Latimer. Vectorize bietet Echtzeit- und nahezu Echtzeit-Datenaktualisierungen, die es den Kunden ermöglichen, ihre Vorlieben für die Datenfrische anzupassen.
„Wir ermöglichen es den Nutzern, die Plattform gemäß ihren akzeptablen Datenveralterungsgrad zu konfigurieren“, sagte er. „Ob sie wöchentliche Datenaktualisierungen oder Echtzeit-Updates benötigen, unsere Plattform kann diesen Bedürfnissen gerecht werden und zeitnahe Updates bereitstellen, sobald die Daten verfügbar sind.“