Qdrant:追求向量資料庫RAG的成本效益解決方案

越來越多的公司努力將檢索增強生成(RAG)系統整合進其技術架構中,促使創新方法的出現以提升這一過程的效率。向量資料庫公司Qdrant相信,其新開發的檢索算法BM42將顯著提高RAG的效率和成本效益。Qdrant成立於2021年,旨在通過BM42增強混合搜索能力,結合語義搜索與關鍵字搜索。Qdrant的聯合創始人及CTO Andrey Vasnetsov解釋,BM42旨在更新廣泛使用的BM25算法,該算法用於在搜索查詢中對文件相關性進行排序。傳統系統通常使用BM25,但RAG則運用向量資料庫,以數學度量表示數據,簡化數據匹配過程。

Vasnetsov指出:「傳統的關鍵字匹配算法如BM25假設文件的大小足以生成統計數據,但RAG處理的是較小的信息塊,使得BM25顯得不足。」BM42利用語言模型從文件中提取相關信息,而不是生成嵌入。這些提取的數據將被標記並計分,使Qdrant能準確識別回答特定查詢所需的信息。

混合搜索提供了多種增強選項。BM42並非唯一努力超越BM25以簡化混合研究和RAG應用的進展。Splade(稀疏詞彙擴展模型)也是一個競爭者。它使用預訓練的語言模型,能夠識別單詞之間的關係,並整合搜索查詢與相關文件之間可能不同的相關術語。雖然一些向量資料庫公司利用Splade,Vasnetsov則聲稱BM42提供了更具成本效益的解決方案。他提到:「Splade的模型大小和計算需求可能非常昂貴。」

RAG作為企業AI的焦點正在快速崛起,組織希望利用生成式AI模型及其專有數據。通過使用RAG,公司能為員工和用戶提供更準確、及時的信息,這些信息來自於組織數據。微軟和亞馬遜等主要參與者目前正提供專為構建RAG應用程序而設的雲計算基礎設施。此外,OpenAI於六月份收購了Rockset,以增強其RAG能力。

雖然RAG允許用戶將AI模型輸出與公司數據連接,但重要的是要承認它仍然是一種語言模型,易受不準確性影響,這些不準確性通常被稱為「幻覺」。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles