如今的大型語言模型(LLMs)變得越來越複雜。然而,它們生成回應所依賴的數據往往是靜態的,導致信息可能會過時數週甚至數月。這一挑戰使得檢索增強生成(RAG)對現代企業至關重要,能夠生成當前的、公司特定的輸出。然而,檢索過程在準確性、可擴展性和安全性方面可能存在困難,特別是在處理複雜的企業內容時。
為了應對這些挑戰,Pryon推出了Pryon檢索引擎,這是一個先進的平台,可以安全地從複雜且分散的內容中提取信息,使組織能夠最大程度地利用當前的AI工具。Pryon總裁兼COO Chris Mahl指出:「生成內容的可靠性值得懷疑,偏見是一個重大問題。有些模型基本上是靜止不動的。雖然你可以提出有見地的問題,但答案卻來自過時的信息,這是一個重大的問題。」
建立一致的知識庫
當前的數據攝取方法在處理基於文檔的複雜內容時經常失敗,導致難以實現大規模的準確性。此外,內容經常散落在不同的系統和格式中。Pryon檢索引擎通過將數百萬個企業數據整合成一個統一的知識庫,即所謂的「集合」,來克服這些障礙。該系統使用語義神經網絡、文檔分析和專有的光學字符識別(OCR)技術從圖像、圖形、表格甚至手寫筆記中提取文本。此外,視頻分割被用來識別關鍵組件、標準化內容並應用視覺語義分割來分類文檔。
用戶可以以多種格式提出問題,在幾毫秒內獲得答案。Mahl形容這種多層次的信息系統為「知識網」,強調其複雜性超越了簡單的檢索。為確保安全性,Pryon引入了訪問控制列表(ACL)來定義用戶的訪問權限。系統也適用於在本地、公有雲和私有雲環境中部署,甚至可以在隔離的設置中運行。
預構建的組件使企業在兩週內就能實施生產就緒的生成AI應用,而無需代碼的介面則允許實時更新內容。該引擎支持API以便自定義部署,並與Microsoft SharePoint、Confluence、AWS S3、Google Drive、Zendesk、ServiceNow和Salesforce等平台無縫集成。「所有專有信息——無論格式如何,從複雜的原理圖到詳細報告——都被安全地提升到模型中,使得用戶能夠進行對話互動並獲得準確、可追溯的答案。」Mahl表示。
跨行業應用
一位客戶利用Pryon在本地整合了40萬份技術文檔,供5000名用戶訪問,可以在幾毫秒內提供準確答案。在另一個案例中,一家消費者遊戲技術公司利用Pryon協助數百萬客戶解決其支持網站上複雜的技術詢問。該平台允許用戶以自然語言提問,並每天多次刷新內容。
同樣,Pryon支持一家工程公司,以快速訪問數百萬份對維護重要系統至關重要的文檔。保險公司也集成了Pryon以提升承保流程,而擁有複雜產品的企業則利用該引擎為銷售團隊提供即時知識。「檢索數據層,即RAG準備的數據層,是一個組織最關鍵的資產。」Mahl強調。「因此,擁有一個安全、可擴展的基礎設施來管理這些信息至關重要。」
駕馭企業中的碎片化數據
數據是組織價值的基礎,但對於數據的理解往往有限。數據存在於各種形式中——視頻、冗長的文本、電子郵件、財務文件,甚至微縮膠卷——使得定位關鍵信息變得困難。企業擁有大量複雜、高價值的數據,可以加速產品開發。然而,為特定項目尋找相關數據幾乎是不可能的。例如,一家芯片工程公司可能擁有數百萬份文檔分散在多個研究部門中。
「與知名企業合作,發現他們的信息是如此碎片化,真是大開眼界。」Mahl表示。「生成AI如今已經問世,但由於組織內部數據的碎片化,面臨著相當大的挑戰。」Mahl強調了安全性的重要性,承認了生成AI帶來的興奮,同時警告關於深刻的隱私和數據安全問題。隨著生成AI預計每年可為全球帶來高達4.4萬億美元的經濟效益,組織仍然對將專有數據暴露於公有LLM和雲端感到謹慎。「我不斷強調安全、安全、安全。」Mahl強調。「這種安全控制的水平是我們的指導原則之一。」
提升AI對問題的理解
要提供準確的答案,AI必須首先理解問題的細微差別。Pryon的系統旨在理解查詢的複雜性,考慮從標題到設計布局的所有方面。該引擎利用查詢擴展、域外檢測和查詢嵌入來解釋自然語言查詢,使用三個專有模型來識別和排名相關內容。
Mahl指出,個人以不同的方式詢問相同的主題。例如,「今年的收入比去年高多少?」與「去年的收入是多少?」相比。「一旦你組織了智能,準備準確地回應以多種方式提出的問題就變得至關重要。」Mahl解釋道。這個過程涉及檢視潛在問題、評估內容,以及生成多種潛在查詢。
確保AI回應的準確歸屬
歸屬對於防止模型「幻覺」,或提供不正確的信息至關重要。「雖然我們當中許多人使用ChatGPT和其他模型,但答案的來源往往不明。」Mahl坦言。Pryon通過確保所有生成的答案都源於可靠的、標準的信息來源來澄清這一點。這使得用戶能夠提出多部分問題,回應來自不同來源,所有內容都有清晰的參考。「Pryon的平台旨在賦予CIO、CTO和技術人員控制其非結構化和半結構化信息的能力,以優化性能。」Mahl總結道。