Mais empresas estão se esforçando para integrar sistemas de geração aumentada por recuperação (RAG) em suas pilhas tecnológicas, levando ao surgimento de métodos inovadores para aprimorar esse processo. A empresa de banco de dados vetorial Qdrant acredita que seu novo algoritmo de busca, BM42, melhorará significativamente a eficiência e a relação custo-benefício do RAG.
Fundada em 2021, a Qdrant visa enriquecer as capacidades de busca híbrida—combinando busca semântica e por palavras-chave—através do BM42. Andrey Vasnetsov, cofundador e CTO da Qdrant, explicou que o BM42 atualiza o amplamente utilizado algoritmo BM25, que classifica a relevância de documentos em consultas de busca. Sistemas tradicionais geralmente utilizam BM25, mas o RAG faz uso de bancos de dados vetoriais que representam os dados como métricas matemáticas, simplificando a correspondência de dados.
Vasnetsov afirmou: “Algoritmos tradicionais de correspondência por palavras-chave, como o BM25, pressupõem que os documentos são grandes o suficiente para gerar estatísticas. No entanto, o RAG trabalha com fragmentos de informação menores, tornando o BM25 inadequado.”
O BM42 utiliza um modelo de linguagem para extrair informações relevantes dos documentos, em vez de gerar embeddings. Esses dados extraídos são tokenizados e depois avaliados, permitindo que a Qdrant identifique com precisão as informações necessárias para responder a consultas específicas.
A busca híbrida apresenta várias opções de aprimoramento. O BM42 não é a única inovação em competição para superar o BM25 na otimização de pesquisas híbridas e aplicações RAG. O Splade, ou modelo de Expansão e Lexicalidade Esparsa, é outro concorrente. Ele utiliza um modelo de linguagem pré-treinado capaz de reconhecer relações entre palavras, incorporando termos relacionados que podem diferir entre a consulta de busca e os documentos relevantes.
Embora algumas empresas de bancos de dados vetoriais utilizem o Splade, Vasnetsov afirma que o BM42 oferece uma solução mais econômica. “O Splade pode ser muito caro devido ao tamanho e às demandas computacionais desses modelos,” observou.
O RAG está emergindo rapidamente como um foco central na IA empresarial, à medida que as organizações buscam aproveitar modelos de IA generativa com seus dados proprietários. Ao utilizar o RAG, as empresas podem fornecer a funcionários e usuários informações mais precisas e oportunas extraídas de dados organizacionais.
Grandes players como Microsoft e Amazon estão agora oferecendo infraestruturas de computação em nuvem projetadas para a construção de aplicações RAG. Além disso, a OpenAI adquiriu a Rockset em junho para aprimorar suas capacidades de RAG.
Embora o RAG permita que os usuários conectem as saídas dos modelos de IA aos dados da empresa, é importante reconhecer que ele continua sendo um modelo de linguagem e é suscetível a imprecisões, muitas vezes referidas como "alucinações".