DataStax 透過強化的 AI 工具更新,幫助企業克服 RAG「地獄」的挑戰。

企業人工智慧的檢索增強生成(RAG):DataStax 概述

檢索增強生成(RAG)對於在企業環境中充分利用生成式人工智慧至關重要,將大型語言模型(LLM)連接到資料庫僅是其起點。DataStax 正在通過一套新技術來解決生產環境中與 RAG 相關的複雜性。

作為商業支援的 Apache Cassandra 資料庫的知名公司,DataStax Astra DB 在過去一年中更加專注於生成式人工智慧與 RAG,這包括整合向量資料庫搜尋功能及提供數據 API,以促進 RAG 應用程序的開發。

企業 RAG 的進展:Langflow 1.0

DataStax 推出的 Langflow 1.0 為企業 RAG 帶來了重大進展,使開發人員能更高效地創建 RAG 和 AI 代理工作流。此外,更新的 Vectorize 工具提供各種向量嵌入模型,RAGStack 1.0 整合了多種工具以支持企業級的部署。

DataStax 的首席產品官 Ed Anuff 指出,RAG 的基本架構看似簡單,但實現企業級效率仍然是普遍挑戰。他形容企業在初次成功的概念驗證後,遇到令人失望結果的現象為「RAG 地獄」。

Anuff 表示,「許多公司在將即時數據集整合到 RAG 應用程式中時遇到了困難。」DataStax 的更新目的是幫助企業克服這些障礙,成功部署其應用程式。

使用 Langflow 構建 RAG 應用

在 4 月 4 日,DataStax 收購了基於開源 LangChain 技術的直觀工具 Langflow。本月,Langflow 1.0 作為一款開源產品正式發布,擁有擴展的組件庫及增強的與其他 DataStax 產品的整合功能。

Langflow 的一大進步是具備圖靈完全性,支持應用中的複雜邏輯流程和條件判斷。這項功能加強了分支和決策能力,使應用能根據聊天記錄或用戶行為等輸入進行調整。Anuff 強調,「這些進展提升了對話代理等應用的使用者體驗,提供了更佳的相關性和互動性。」

RAG 中向量與非結構化數據的角色

在 RAG 中,向量嵌入存儲於向量資料庫中,嵌入模型的選擇非常關鍵。DataStax 的 Vectorize 技術允許用戶在多樣的嵌入模型中選擇,以符合他們的數據集需求,涵蓋 Azure OpenAI、Hugging Face 和 NVIDIA NeMo 等提供者的模型。

Anuff 解釋說,「這些不同的嵌入模型具有各自的最佳化和權衡選擇,選擇正確的模型能顯著提升性能。」

為進一步提升 RAG 實施的準確性,DataStax 與 unstructured.io 合作,在向量化之前對非結構化數據進行構造。Anuff 強調,這項整合能增加人工智慧應用的精確度和準確性。

RAGStack 1.0 與 ColBERT 的引入

這些發展的核心是 RAGStack 1.0,一個聚焦於企業的框架,將多種人工智慧生態系統組件與 DataStax 的專有工具整合。在此次發布中,值得注意的新增功能是 ColBERT(上下文化的 BERT 表示),這是一種召回算法,增強 RAG 應用中的上下文匹配和相關性。

Anuff 評論道,「使用 ColBERT 就像是在尋找針,能自信地定位到精確的目標,而不是在不相關的數據中篩查。」

總之,DataStax 正在改變企業部署 RAG 和生成式人工智慧的方式,提供優化效率和相關性所需的工具。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles