SingleStore verbessert die Datenbank für generative KI-Workloads
SingleStore bringt heute ein neues Update heraus, das die Fähigkeiten seiner Datenbankplattform für generative KI, transaktionale und analytische Workloads erheblich erweitert. Die aktualisierte SingleStore Pro Max-Datenbank, auch bekannt als SingleStore 8.5, führt eine fortschrittliche indizierte Vektorsuche ein, die es Unternehmen ermöglicht, generative KI-Anwendungen und den Anwendungsfall der retrieval-augmented generation (RAG) effektiv zu erstellen und zu unterstützen.
Historischer Kontext der Vektorfähigkeiten
Die neue Vektorsuche stellt nicht die erste Einführung von Vektorfunktionen in der SingleStore-Datenbank dar. Diese Technologie ist seit 2017 Teil der Angebote, als das Unternehmen noch als MemSQL bekannt war. Nach der Umbenennung im Jahr 2020 hat SingleStore Online Analytical Processing (OLAP) und Online Transaction Processing (OLTP) zu einer einheitlichen Datenbankplattform zusammengeführt.
Mit dem Anstieg von generativen KI-Workloads ist die Nachfrage nach Vektordatenbank-Funktionen gestiegen. Native Plattformen wie Pinecone sind entstanden, während etablierte Datenbankanbieter wie DataStax, Neo4j, MongoDB, PostgreSQL und Oracle beginnen, Vektorfähigkeiten zu integrieren. Laut dem CEO von SingleStore, Raj Verma, reicht es nicht aus, eine dedizierte Vektordatenbank anzubieten. Er betont die Bedeutung der Integration bestehender Datenbankfunktionen.
Verma erklärte: „Wir bieten einen generativen KI-Stack an, der Vektoren umfasst, und ermöglichen es Ihnen, generative KI-Anwendungen zu erstellen und zu modellieren. Eine Vektordatenbank allein ist lediglich ein Feature, nicht die langfristige Lösung, da sie unnötige Komplexität in Ihren KI-Stack einführt.“
Hybride Suche über verschiedene Datentypen
SingleStore fungiert gleichzeitig als Hybrid Transactional and Analytical Processing (HTAP)-Datenbank, die in der Lage ist, verschiedene Datentypen zu speichern, zu verarbeiten und abzufragen. Das Pro Max-Update verbessert die Vektorsuche für sowohl strukturierte als auch unstrukturierte Daten. Obwohl SingleStore seit 2017 Vektorsuche unterstützt, umfasst die neueste Version fortschrittliche Algorithmen wie Product Quantization (PQ), Hierarchical Navigable Small World (HNSW) und Approximate Nearest Neighbor (ANN)-Indexierung für schnellere und präzisere Suchergebnisse.
Die verbesserten Vektorsuche-Funktionen stellen sicher, dass Unternehmen alle in SingleStore gespeicherten Daten für effektive Suchen und die Entwicklung von generativen KI-Anwendungen nutzen können. Verma betonte, dass vektorgeeignete Datenbanken den Einstieg in die generative KI erleichtern könnten, oft aber die Komplexität der breiteren Datenlandschaft eines Unternehmens verdrängen.
„Einfach nur Vektoren hinzuzufügen, kaschiert nicht die Komplexität des Datenbestands eines Unternehmens“, stellte er fest.
Verma erläuterte die Vision von SingleStore, als umfassende Vektordatenbank innerhalb eines vereinfachten Datenökosystems zu agieren, das alle erforderlichen Datentypen umfasst. „Nur durch Vereinfachung und Datenkonsolidierung können Unternehmen die Geschwindigkeit und Effizienz erreichen, die für ein florierendes generatives KI-Datenumfeld erforderlich sind“, sagte er.
Verbesserte Change Data Capture mit Apache Iceberg
In der heutigen Datenlandschaft ist es ungewöhnlich, dass Unternehmen alle ihre Daten in einer einzigen Datenbank zentralisieren. Häufig verlaufen Datenpipelines über mehrere Repositories und Anwendungen. Eine gängige Methode zur Erfassung von Daten aus externen Quellen in einer Datenbank ist die Change Data Capture (CDC).
Die SingleStore Pro Max bietet verbesserte CDC-Funktionen, die es Benutzern ermöglichen, Daten aus MySQL, MongoDB und Apache Iceberg-basierten Datenbanken in einer zentralen Datenbank zu integrieren. Diese Unterstützung für Apache Iceberg, ein Open-Source-Datenbankformat, das bei führenden Anbietern wie IBM und Snowflake beliebt ist, ist besonders bedeutend. Verma hob die fortlaufenden Partnerschaften von SingleStore mit IBM und Snowflake hervor und stellte fest, dass die Unterstützung von Iceberg die Integrationsherausforderungen erheblich erleichtern wird.
„Die CDC-Funktion ermöglicht es unseren Kunden, Daten aus verschiedenen Quellen in SingleStore zu aggregieren, was für den gesamten Workflow der retrieval-augmented generation entscheidend ist,“ sagte Verma.