SingleStore Améliore Sa Base de Données pour les Charges de Travail en IA Générative
SingleStore lance aujourd'hui une nouvelle version qui renforce considérablement les capacités de sa plateforme de base de données pour les charges de travail en IA générative, transactionnelle et analytique. La mise à jour de la base de données SingleStore Pro Max, également connue sous le nom de SingleStore 8.5, introduit une fonctionnalité avancée de recherche vectorielle indexée, permettant aux organisations de construire et de soutenir efficacement des applications d'IA générative et des cas d'utilisation de génération augmentée par récupération (RAG).
Contexte Historique des Capacités Vectorielles
Cette nouvelle fonctionnalité de recherche vectorielle indexée ne marque pas la première introduction des capacités vectorielles dans la base de données de SingleStore. Cette technologie fait partie de ses offres depuis 2017, lorsqu’elle était connue sous le nom de MemSQL. Après son rebranding en 2020, SingleStore a fusionné le traitement analytique en ligne (OLAP) et le traitement transactionnel en ligne (OLTP) en une plateforme de base de données unifiée.
Avec l'essor des charges de travail en IA générative, la demande pour des fonctionnalités de bases de données vectorielles a considérablement augmenté. Des plateformes natives comme Pinecone ont émergé, tandis que des fournisseurs de bases de données établis tels que DataStax, Neo4j, MongoDB, PostgreSQL et Oracle commencent à intégrer des capacités vectorielles. Selon le PDG de SingleStore, Raj Verma, proposer simplement une base de données vectorielle dédiée n'est pas suffisant pour les organisations, soulignant l'importance d'intégrer les fonctionnalités de base de données existantes.
Verma a déclaré : « Nous fournissons un ensemble d'IA générative comprenant des vecteurs, vous permettant de construire et de modéliser des applications d'IA générative. Une base de données uniquement vectorielle n'est qu'une fonctionnalité, pas une solution à long terme, car elle introduit une complexité inutile dans votre pile d'IA. »
Recherche Hybride à Travers Divers Types de Données
SingleStore remplit une double fonction en tant que base de données de traitement transactionnel et analytique hybride (HTAP), capable de stocker, traiter et interroger divers types de données. La version Pro Max améliore les capacités de recherche vectorielle pour les données structurées et non structurées. Bien que SingleStore soutienne la recherche vectorielle depuis 2017, la dernière version inclut des algorithmes avancés tels que la Quantification de Produit (PQ), l’Indexation par World Navigable Hiérarchique (HNSW), et les Voisins Approximativement Proches (ANN) pour des résultats de recherche plus rapides et précis.
Les capacités de recherche vectorielle améliorées garantissent que les organisations peuvent tirer parti de toutes les données stockées dans SingleStore pour des recherches efficaces et le développement d’applications d'IA générative. Verma a souligné que bien que les bases de données axées sur les vecteurs puissent faciliter l’entrée dans l’IA générative, elles négligent souvent les complexités du paysage de données plus large d'une organisation.
« Ajouter simplement des vecteurs ne masquera pas les complexités de l’état des données d’une organisation, » a-t-il affirmé.
Verma a élaboré sur la vision de SingleStore en tant que base de données vectorielle complète au sein d'un écosystème de données simplifié englobant tous les types de données nécessaires. « Ce n’est qu’à travers la simplification et la consolidation des données que les organisations peuvent atteindre la vitesse et l’efficacité nécessaires pour un estate de données d'IA générative prospère, » a-t-il déclaré.
Amélioration de la Capture de Données Modifiées avec Apache Iceberg
Dans le paysage actuel des données, il est rare que les organisations centralisent toutes leurs données dans une seule base de données. Au lieu de cela, les pipelines de données s'étendent souvent sur plusieurs dépôts et applications. Une méthode courante pour ingérer des données provenant de sources externes au sein d'une base de données est la Capture de Données Modifiées (CDC).
Le SingleStore Pro Max propose des capacités CDC améliorées qui permettent aux utilisateurs d'intégrer des données provenant de MySQL, MongoDB et de lacs de données basés sur Apache Iceberg dans une base de données centralisée. Ce soutien pour Apache Iceberg, un format de tableau de lac de données open-source populaire parmi des leaders comme IBM et Snowflake, est particulièrement significatif. Verma a souligné les partenariats en cours de SingleStore avec IBM et Snowflake, notant que le support d'Iceberg facilitera considérablement les défis d'intégration.
« La capacité CDC permet à nos clients d'agréger des données provenant de diverses sources dans SingleStore, ce qui est crucial pour l'ensemble du flux de travail de génération augmentée par récupération, » a déclaré Verma.