Qdrant: 벡터 데이터베이스 RAG에서 비용 효율적인 솔루션을 목표로하다

더 많은 기업들이 검색 강화 생성(RAG) 시스템을 기술 스택에 통합하기 위해 노력하고 있으며, 이 과정에서 혁신적인 방법들이 등장하고 있습니다. 벡터 데이터베이스 기업인 Qdrant는 새롭게 개발한 검색 알고리즘 BM42가 RAG의 효율성과 비용 효율성을 크게 향상시킬 것이라고 믿고 있습니다. 2021년에 설립된 Qdrant는 BM42를 통해 의미 검색과 키워드 검색을 결합한 하이브리드 검색 기능을 강화하는 것을 목표로 하고 있습니다. Qdrant의 공동 창립자이자 CTO인 Andrey Vasnetsov는 BM42가 문서의 관련성을 검색 쿼리에서 평가하는 데 널리 사용되는 BM25 알고리즘의 업그레이드 역할을 한다고 설명했습니다. 전통적인 시스템은 보통 BM25를 사용하지만, RAG는 데이터를 수학적 메트릭으로 표현하는 벡터 데이터베이스를 사용하여 데이터 매칭을 간소화합니다.

Vasnetsov는 “전통적인 키워드 매칭 알고리즘인 BM25는 문서 크기가 통계 생성에 충분하다고 가정합니다. 하지만 RAG는 더 작은 정보 조각을 사용하므로 BM25는 부적절합니다.”라고 말했습니다. BM42는 문서에서 관련 정보를 추출하기 위해 언어 모델을 활용하며, 추출된 데이터는 토큰화되어 점수가 매겨집니다. 이를 통해 Qdrant는 특정 쿼리에 응답하는 데 필요한 정보를 정확히 식별할 수 있습니다.

하이브리드 검색은 여러 가지 향상 옵션을 제공합니다. BM42는 하이브리드 검색 및 RAG 응용 프로그램에서 BM25를 뛰어넘기 위한 유일한 진화가 아닙니다. Splade, 즉 희소 어휘 및 확장 모델도 또 다른 경쟁자입니다. Splade는 검색 쿼리와 관련 문서 간에 다를 수 있는 관련 용어를 포함하면서 단어 관계를 인식할 수 있는 사전 훈련된 언어 모델을 사용합니다. 일부 벡터 데이터베이스 기업들이 Splade를 활용하고 있지만, Vasnetsov는 BM42가 더 비용 효율적인 솔루션이라고 주장합니다. “Splade는 모델의 크기와 계산 수요로 인해 매우 비쌀 수 있습니다.”라고 그는 언급했습니다.

RAG는 기업 AI의 주요 초점으로 급격히 부각되고 있습니다. 기업들은 자사 데이터를 활용하여 생성형 AI 모델을 활용하려고 합니다. RAG를 활용함으로써, 기업들은 직원과 사용자에게 조직 데이터에서 추출된 보다 정확하고 신속한 정보를 제공할 수 있습니다. Microsoft와 Amazon과 같은 주요 기업들은 이제 RAG 응용 프로그램 구축을 위한 클라우드 컴퓨팅 인프라를 제공하고 있습니다. 또한 OpenAI는 RAG 기능을 강화하기 위해 6월에 Rockset을 인수했습니다.

RAG는 사용자들이 AI 모델의 결과를 회사 데이터에 연결할 수 있도록 하지만, 여전히 언어 모델로서 부정확성, 즉 "환각"에 취약하다는 점을 인식하는 것이 중요합니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles