Qdrant: Buscando Soluciones Rentables en la Base de Datos Vectorial RAG

Cada vez más empresas buscan integrar sistemas de generación aumentada por recuperación (RAG) en sus pilas tecnológicas, lo que ha llevado a la aparición de métodos innovadores para mejorar este proceso. La firma de bases de datos vectoriales Qdrant confía en que su nuevo algoritmo de búsqueda, BM42, mejorará significativamente la eficiencia y la rentabilidad de RAG.

Fundada en 2021, Qdrant tiene como objetivo enriquecer las capacidades de búsqueda híbrida, combinando búsquedas semánticas y por palabras clave a través de BM42. Andrey Vasnetsov, cofundador y CTO de Qdrant, explicó que BM42 es una actualización del algoritmo BM25, ampliamente utilizado para clasificar la relevancia de documentos en consultas de búsqueda. Los sistemas tradicionales suelen utilizar BM25, pero RAG emplea bases de datos vectoriales que representan datos como métricas matemáticas, simplificando la coincidencia de datos.

Vasnetsov afirmó: “Los algoritmos tradicionales de coincidencia por palabras clave como BM25 suponen que los documentos son lo suficientemente grandes para generar estadísticas. Sin embargo, RAG trabaja con fragmentos de información más pequeños, lo que hace que BM25 sea inadecuado.” BM42 utiliza un modelo de lenguaje para extraer información relevante de los documentos en lugar de generar incrustaciones. Estos datos extraídos se tokenizan y puntúan, permitiendo que Qdrant identifique con precisión la información necesaria para responder consultas específicas.

La búsqueda híbrida presenta diversas opciones para mejorar. BM42 no es el único avance que busca superar a BM25 en la optimización de la investigación híbrida y las aplicaciones RAG. Splade, o modelo de Expansión y Léxicos Sparse, es otro contendiente. Utiliza un modelo de lenguaje preentrenado que puede reconocer relaciones de palabras e incorporar términos relacionados que pueden diferir entre la consulta de búsqueda y los documentos relevantes.

Si bien algunas empresas de bases de datos vectoriales utilizan Splade, Vasnetsov sostiene que BM42 ofrece una solución más rentable. “Splade puede ser muy caro debido al tamaño y las demandas computacionales de estos modelos,” observó.

RAG está emergiendo rápidamente como un punto focal en la IA empresarial, ya que las organizaciones buscan aprovechar modelos de IA generativa con sus datos propietarios. Al utilizar RAG, las empresas pueden proporcionar a empleados y usuarios información más precisa y oportuna basada en datos organizacionales.

Grandes jugadores como Microsoft y Amazon ya están ofreciendo infraestructuras de computación en la nube diseñadas para construir aplicaciones RAG. Además, OpenAI adquirió Rockset en junio para mejorar sus capacidades RAG. Aunque RAG permite a los usuarios conectar los resultados de modelos de IA con datos de la empresa, es importante reconocer que sigue siendo un modelo de lenguaje y es susceptible a imprecisiones, a menudo denominadas "alucinaciones."

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles