Quando Edo Liberty estava concluindo seu doutorado em Ciência da Computação em Yale, com foco em projeções aleatórias, ele não poderia imaginar que uma década depois, esse conceito seria essencial para a inteligência artificial moderna. Liberty é o fundador e CEO da Pinecone, uma líder em tecnologia de bancos de dados vetoriais, que já arrecadou mais de $138 milhões, incluindo uma rodada significativa de $100 milhões em 2023. As projeções aleatórias, que serviram como base para sua tese, agora representam um elemento fundamental na busca vetorial. Em 2024, a tecnologia de bancos de dados vetoriais passou de uma área nichada para um componente crucial que viabiliza as capacidades de Geração Aumentada de Recuperação (RAG) na IA generativa.
Quando a Pinecone foi lançada em 2019, os bancos de dados vetoriais não eram amplamente reconhecidos. No entanto, hoje, todos os principais fornecedores de bancos de dados — incluindo Oracle, MongoDB, DataStax e Google Cloud — oferecem funcionalidades para bancos de dados vetoriais. A Pinecone está se destacando entre as tecnologias de bancos de dados vetoriais de várias maneiras. Recentemente, a empresa anunciou a disponibilidade geral de seu banco de dados sem servidor em todos os três principais provedores de nuvem: AWS, Microsoft Azure e Google Cloud. Juntamente com essa disponibilidade, a Pinecone está introduzindo uma gama de novos recursos para aprimorar a funcionalidade e a utilidade de sua plataforma.
“Evoluímos de uma pequena equipe desenvolvendo um produto obscuro para nos tornarmos um líder na categoria de banco de dados mais quente do mundo,” compartilhou Liberty com a mídia.
Como Funciona o Banco de Dados Vetorial Sem Servidor da Pinecone
A Pinecone apresentou seu banco de dados vetorial sem servidor em janeiro, inicialmente disponível na AWS. Com o recente anúncio, agora também está acessível no Google Cloud e Microsoft Azure. A essência da abordagem sem servidor é fornecer uma solução otimizada e gerida, onde os custos são baseados no uso. Liberty destaca a facilidade de uso, uma vez que elimina as complexidades associadas à gestão da infraestrutura.
“Como cliente, você não interage com conceitos de computação; você não seleciona tamanhos de nós ou CPUs,” explicou Liberty. “Você gerencia leituras, gravações e armazenamento com base na capacidade.” A escalabilidade é outra vantagem significativa do modelo sem servidor. Os usuários podem iniciar aplicações sem se preocupar com o número de vetores, seja cinco mil ou cinco bilhões. “Você cria um índice e começa a usar o serviço,” afirmou.
Novos Recursos que Aprimoram o Banco de Dados Vetorial Sem Servidor da Pinecone
A disponibilidade geral do banco de dados vetorial sem servidor da Pinecone também introduz diversos novos recursos. Uma adição notável são as capacidades de importação em massa de dados, que permitem aos usuários transferir grandes conjuntos de dados facilmente de uma nuvem para outra, possibilitando a criação de índices extensos de forma eficiente e a baixo custo. A Pinecone também está implementando o Controle de Acesso Baseado em Funções (RBAC) em sua oferta sem servidor. Embora o RBAC esteja tipicamente associado à segurança, Liberty afirma que sua principal vantagem reside na melhoria da governança de dados por meio de medidas práticas de controle de acesso.
“Quando você constrói com infraestrutura, controlar quem tem direitos de leitura, gravação e exclusão é crucial. O controle de acesso baseado em funções possibilita isso,” explicou.
Além dessa atualização de banco de dados, a Pinecone está lançando um novo kit de desenvolvimento de software (SDK) projetado para facilitar a integração da Pinecone nos fluxos de trabalho de aplicações, particularmente para aplicações .NET.
Por que a Pinecone se Destaca em Meio à Concorrência
Apesar do número crescente de fornecedores oferecendo suporte a bancos de dados vetoriais, Liberty mantém uma forte crença nas vantagens distintas da Pinecone. Ele argumenta que fornecedores de bancos de dados que adotam uma abordagem multi-modelo — tratando vetores apenas como outro tipo de dado — estão em desvantagem em comparação à Pinecone, que consistentemente foca na tecnologia vetorial. “Desde o primeiro dia, priorizamos uma experiência excepcional para os desenvolvedores. Uma vez que os usuários se envolvem, eles descobrem que somos a solução mais escalável, eficiente e econômica para busca vetorial,” enfatizou Liberty. “Nosso foco permanece na prontidão para produção e no atendimento às empresas.”