SingleStore Melhora Banco de Dados para Cargas de Trabalho de IA Generativa
SingleStore lança hoje uma nova versão que aprimora significativamente as capacidades de sua plataforma de banco de dados para cargas de trabalho de IA generativa, transacionais e analíticas.
O banco de dados SingleStore Pro Max, também conhecido como SingleStore 8.5, introduz uma funcionalidade avançada de busca vetorial indexada, permitindo que organizações construam e suportem aplicações de IA generativa e casos de uso de geração aumentada por recuperação (RAG).
Contexto Histórico das Capacidades Vetoriais
A nova melhoria de busca vetorial indexada não é a primeira introdução de capacidades vetoriais no banco de dados da SingleStore. A tecnologia faz parte das ofertas desde 2017, quando a empresa era conhecida como MemSQL. Com a rebranding em 2020, a SingleStore unificou o Processamento Analítico Online (OLAP) e o Processamento Transacional Online (OLTP) em uma única plataforma de banco de dados.
Com o aumento das cargas de trabalho de IA generativa, a demanda por recursos de banco de dados vetorial disparou. Plataformas nativas como Pinecone surgiram, enquanto fornecedores estabelecidos, como DataStax, Neo4j, MongoDB, PostgreSQL e Oracle, começaram a incorporar capacidades vetoriais. Segundo o CEO da SingleStore, Raj Verma, oferecer apenas um banco de dados vetorial dedicado não é suficiente para as organizações, ressaltando a importância de integrar funcionalidades de banco de dados existentes.
Verma afirmou: “Nós fornecemos um stack de IA generativa que inclui vetores, permitindo que você construa e modele aplicações de IA generativa. Um banco de dados apenas para vetores é apenas um recurso, não uma solução a longo prazo, pois introduz complexidade desnecessária em seu stack de IA."
Busca Híbrida em Diversos Tipos de Dados
SingleStore atua como um banco de dados de Processamento Transacional e Analítico Híbrido (HTAP), capaz de armazenar, processar e consultar vários tipos de dados. O lançamento do Pro Max aprimora as capacidades de busca vetorial para dados estruturados e não estruturados. Embora a SingleStore ofereça suporte à busca vetorial desde 2017, a versão mais recente inclui algoritmos avançados, como Quantização de Produto (PQ), Mundo Pequeno Navegável Hierárquico (HNSW) e Índice de Vizinhos Próximos Aproximados (ANN) para resultados de busca mais rápidos e precisos.
As capacidades de busca vetorial aprimoradas garantem que as organizações possam aproveitar todos os dados armazenados no SingleStore para buscas eficazes e desenvolvimento de aplicações de IA generativa. Verma enfatizou que, embora bancos de dados focados em vetores possam facilitar a entrada em IA generativa, geralmente ignoram as complexidades do amplo ecossistema de dados de uma organização.
“Ao adicionar vetores, não se disfarçam as complexidades da situação dos dados de uma organização,” afirmou.
Verma elaborou sobre a visão da SingleStore de servir como um banco de dados vetorial abrangente dentro de um ecossistema de dados simplificado que inclua todos os tipos de dados necessários. “Somente através da simplificação e consolidação de dados as organizações podem alcançar a velocidade e eficiência necessárias para um ambiente de dados de IA generativa próspero,” disse ele.
Aprimoramento da Captura de Dados em Mudança com Apache Iceberg
No cenário de dados atual, é incomum que as organizações centralizem todos os seus dados em um único banco de dados. Em vez disso, os pipelines de dados frequentemente abrangem múltiplos repositórios e aplicações. Um método comum para ingestão de dados de fontes externas em um banco de dados é por meio da Captura de Dados em Mudança (CDC).
O SingleStore Pro Max apresenta capacidades de CDC aprimoradas que permitem aos usuários integrar dados do MySQL, MongoDB e lagos de dados baseados em Apache Iceberg em um banco de dados centralizado. Esse suporte ao Apache Iceberg, um formato de tabela de lago de dados de código aberto popular entre os principais fornecedores como IBM e Snowflake, é especialmente significativo. Verma destacou as parcerias contínuas da SingleStore com a IBM e a Snowflake, observando que o suporte ao Iceberg facilitará significativamente os desafios de integração.
“A capacidade de CDC permite que nossos clientes agreguem dados de várias fontes no SingleStore, o que é crucial para todo o fluxo de trabalho de geração aumentada por recuperação,” disse Verma.