Chet Kapoor, CEO da DataStax—uma empresa de banco de dados em nuvem que utiliza o Apache Cassandra de código aberto—afirmou na conferência AI.Dev, no Vale do Silício, que o Cassandra é o “melhor banco de dados para inteligência artificial generativa”.
Agentes de IA Estão Chegando
Kapoor fez suas declarações para uma plateia de 700 pessoas durante o evento da Linux Foundation, destacando a competição acirrada entre startups e empresas consolidadas que buscam liderança no espaço em rápida evolução da IA generativa. À medida que marcas corporativas exploram opções tecnológicas, a escolha de provedores de banco de dados se torna crucial. Embora provedores de modelos de linguagem grandes (LLMs), como OpenAI, Anthropic, Google (Gemini) e Meta (Llama), gerem grande expectativa, a batalha pela supremacia em banco de dados entre empresas que apoiam aplicações de LLM é igualmente intensa.
Em sua palestra, Kapoor destacou várias razões pelas quais o banco de dados Cassandra da DataStax se destaca. Ele é um dos bancos de dados operacionais mais confiáveis, amplamente utilizado por empresas. Muitas organizações já implementaram com sucesso a IA generativa em larga escala utilizando o Cassandra, cujas vantagens tecnológicas o fazem superar concorrentes como MongoDB e Pinecone.
A DataStax também está considerando uma oferta pública, e Kapoor parece ansioso para despertar o interesse. Em junho passado, a empresa levantou 115 milhões de dólares com uma avaliação de 1,6 bilhão de dólares. Embora a DataStax não tenha divulgado detalhes financeiros, Kapoor observou que a empresa está no radar de bancos que buscam levar empresas ao mercado público entre 2024-2025.
Pontos Chave de Kapoor:
1. Popularidade e Confiabilidade do Cassandra
O Cassandra é um banco de dados operacional líder, especialmente com empresas como Microsoft e Amazon promovendo seus serviços em nuvem com bancos de dados integrados para IA generativa. Esses gigantes tecnológicos incentivaram os usuários a adotarem suas plataformas ao eliminar barreiras, como processos complexos de migração de dados.
Kapoor criticou de forma humorística esses provedores de nuvem por complicarem as soluções: “Tem um para ir ao banheiro de manhã... um para a tarde e um para a noite.” Ele explicou que a IA generativa fez com que CIOs corporativos buscassem bancos de dados integrados para consultas mais fluidas, uma área onde o Cassandra se destaca. Em contrapartida, os bancos de dados da Microsoft e da Amazon costumam focar em cargas de trabalho analíticas, o que pode resultar em ineficiências dispendiosas nas tarefas operacionais relacionadas à IA generativa.
A DataStax prioriza a relação custo-benefício e desempenho, atraindo clientes da Fortune 500. Usuários notáveis do Cassandra incluem Netflix para metadados de filmes, FedEx para rastreamento de pacotes, Apple para dados do iCloud e iMessage e Home Depot para operações do site. À medida que as organizações desenvolvem novas aplicações de IA, seu sucesso consolidado com o Cassandra estimula a continuidade em torno dessa tecnologia.
2. Implantações Ativas de IA Generativa
Kapoor destacou nove empresas que utilizam o banco de dados em nuvem Astra DB da DataStax para IA generativa. Enquanto muitas empresas estão experimentando a IA generativa, poucas avançaram para produção em grande escala, principalmente devido a preocupações com segurança e confiabilidade. Com o aumento da tensão no setor, espera-se uma mudança nos gastos em direção a implantações reais no próximo ano.
Alguns clientes notáveis que estão implantando LLMs incluem:
- Physics Wallah: uma plataforma educacional indiana que alcança 6 milhões de usuários com um bot versátil impulsionado por LLM, desenvolvido em apenas 55 dias.
- Skypoint: um serviço de saúde para idosos que utiliza um LLM para planejamento de tratamento personalizado, economizando mais de 10 horas semanais para os médicos.
Outros incluem Hey You, Reel Star, Arre, Hornet, Restworld, Sourcetable e Concide. Kapoor observou que pequenas e médias empresas podem adaptar-se rapidamente, enquanto grandes empresas enfrentam mais obstáculos regulatórios.
3. Desempenho Superior da Tecnologia
Kapoor ressaltou os avanços da DataStax nas capacidades de busca vetorial do Astra, um componente crítico para bancos de dados de IA generativa. A tecnologia JVector do Astra oferece 16% mais relevância em comparação com o concorrente líder Pinecone, o que é significativo para garantir resultados precisos. Um próximo relatório de benchmark proporcionará mais insights, mas descobertas preliminares indicam que o Astra entrega um processamento de transações superior em comparação com Pinecone e MongoDB.
O Astra DB oferece acesso sem latência a dados vetorizados, desde a indexação até as consultas.
O Futuro: Adoção Rápida da IA Generativa
Kapoor previu que a adoção de IA generativa ocorrerá mais rapidamente do que revoluções tecnológicas anteriores, aproveitando estruturas existentes como tecnologias web, móveis e em nuvem. Ele antecipa que casos de uso geradores de receita transformadores surgirão no próximo ano, incluindo funcionalidades avançadas de LLM que permitem que agentes de IA realizem tarefas complexas. Receita material de integrações de IA generativa pode se manifestar já no segundo trimestre de 2024, especialmente em setores como varejo e turismo.
Enquanto Kapoor e Anuff destacaram as strengths do Cassandra, eles reconheceram que a IA generativa impulsionará o setor de bancos de dados como um todo. As demandas das aplicações de IA exigem maior capacidade de armazenamento e recursos computacionais, atraindo a atenção de provedores de nuvem e bancos de dados. “Se as aplicações de IA se tornarem um grande negócio, elas serão o principal motor de crescimento tanto para empresas de banco de dados privadas quanto públicas nos próximos cinco anos”, afirmou Anuff.