Qdrant: Buscando Soluções Econômicas em RAG para Banco de Dados Vetoriais

Mais empresas estão se esforçando para integrar sistemas de geração aumentada por recuperação (RAG) em suas pilhas tecnológicas, levando ao surgimento de métodos inovadores para aprimorar esse processo. A empresa de banco de dados vetorial Qdrant acredita que seu novo algoritmo de busca, BM42, melhorará significativamente a eficiência e a relação custo-benefício do RAG.

Fundada em 2021, a Qdrant visa enriquecer as capacidades de busca híbrida—combinando busca semântica e por palavras-chave—através do BM42. Andrey Vasnetsov, cofundador e CTO da Qdrant, explicou que o BM42 atualiza o amplamente utilizado algoritmo BM25, que classifica a relevância de documentos em consultas de busca. Sistemas tradicionais geralmente utilizam BM25, mas o RAG faz uso de bancos de dados vetoriais que representam os dados como métricas matemáticas, simplificando a correspondência de dados.

Vasnetsov afirmou: “Algoritmos tradicionais de correspondência por palavras-chave, como o BM25, pressupõem que os documentos são grandes o suficiente para gerar estatísticas. No entanto, o RAG trabalha com fragmentos de informação menores, tornando o BM25 inadequado.”

O BM42 utiliza um modelo de linguagem para extrair informações relevantes dos documentos, em vez de gerar embeddings. Esses dados extraídos são tokenizados e depois avaliados, permitindo que a Qdrant identifique com precisão as informações necessárias para responder a consultas específicas.

A busca híbrida apresenta várias opções de aprimoramento. O BM42 não é a única inovação em competição para superar o BM25 na otimização de pesquisas híbridas e aplicações RAG. O Splade, ou modelo de Expansão e Lexicalidade Esparsa, é outro concorrente. Ele utiliza um modelo de linguagem pré-treinado capaz de reconhecer relações entre palavras, incorporando termos relacionados que podem diferir entre a consulta de busca e os documentos relevantes.

Embora algumas empresas de bancos de dados vetoriais utilizem o Splade, Vasnetsov afirma que o BM42 oferece uma solução mais econômica. “O Splade pode ser muito caro devido ao tamanho e às demandas computacionais desses modelos,” observou.

O RAG está emergindo rapidamente como um foco central na IA empresarial, à medida que as organizações buscam aproveitar modelos de IA generativa com seus dados proprietários. Ao utilizar o RAG, as empresas podem fornecer a funcionários e usuários informações mais precisas e oportunas extraídas de dados organizacionais.

Grandes players como Microsoft e Amazon estão agora oferecendo infraestruturas de computação em nuvem projetadas para a construção de aplicações RAG. Além disso, a OpenAI adquiriu a Rockset em junho para aprimorar suas capacidades de RAG.

Embora o RAG permita que os usuários conectem as saídas dos modelos de IA aos dados da empresa, é importante reconhecer que ele continua sendo um modelo de linguagem e é suscetível a imprecisões, muitas vezes referidas como "alucinações".

Most people like

Find AI tools in YBX