O mercado de bancos de dados vetoriais prosperou em 2023, impulsionado pela necessidade de contexto e memória de longo prazo em grandes modelos de linguagem, que, por sua vez, aumentam a eficiência e precisão das técnicas de geração aumentada por recuperação (RAG). Esse avanço visa mitigar alucinações da IA. Liderando esse cenário competitivo está a startup Pinecone, baseada na cidade de Nova York, que arrecadou US$ 100 milhões em financiamento em abril passado.
Recentemente, a Pinecone revelou o que descreve como uma arquitetura de banco de dados vetorial sem servidor "revolucionária". Essa solução inovadora permite que empresas desenvolvam aplicações de IA mais perspicazes e econômicas. De acordo com um comunicado à imprensa, o modelo sem servidor da Pinecone deve proporcionar reduções de custo de até 50%, ao mesmo tempo em que elimina complexidades de infraestrutura, permitindo que os negócios lancem aplicações de IA generativa superiores de forma mais rápida.
A empresa destacou várias inovações-chave, incluindo:
- Separação de leituras, gravações e armazenamento para reduzir custos operacionais.
- Uma arquitetura pioneira que apresenta agrupamento vetorial em armazenamento blob, facilitando buscas vetoriais de baixo tempo de resposta e custo em vastos conjuntos de dados.
- Algoritmos de indexação e recuperação personalizados.
- Uma camada de computação multi-inquilino que suporta recuperação sob demanda para milhares de usuários.
O CEO da Pinecone, Edo Liberty, enfatizou a importância dessa nova arquitetura sem servidor, afirmando: “Não estou dizendo isso levianamente. Estamos dedicados a este projeto há um ano e meio; é nosso empreendimento mais ambicioso.” Ele reiterou que o objetivo vai além de criar o melhor banco de dados vetorial. “Queremos permitir uma nova geração de aplicações de IA generativa que antes eram impossíveis,” explicou, expressando confiança no papel da Pinecone em lidar com alucinações de IA que têm impedido as empresas de lançar soluções de IA generativa centradas no cliente.
Empresas como Notion, Blackstone, Canva, Domo e Gong já estão utilizando a tecnologia sem servidor da Pinecone. Liberty observou que o novo produto está equipado com a infraestrutura robusta necessária para indexar bilhões de vetores para milhares, senão centenas de milhares, de usuários, garantindo escalabilidade em RAG e gestão do conhecimento. “Eles podem fazer isso de forma mais fácil e a um custo de 10 a 100 vezes menor do que os sistemas anteriores,” acrescentou.
A introdução da solução sem servidor da Pinecone reflete uma maturação na pilha de tecnologia de IA generativa. O lançamento inclui integrações com outros líderes no domínio da IA, como Anthropic, Anyscale, Cohere, Confluent, Langchain, Pulumi e Vercel. Liberty comentou: “A colaboração entre esses players-chave indica que a pilha de tecnologia está evoluindo, permitindo que os desenvolvedores criem produtos poderosos que funcionem em conjunto de maneira fluida.”