Pryon 提升检索增强生成技术,提供即时、安全且可追溯的答案

今天的大型语言模型(LLMs)日益复杂。然而,它们生成回答所依赖的数据往往静态不变,造成信息可能延迟数周甚至数月。这个挑战使得检索增强生成(RAG)对现代企业至关重要,从而实现生成当前的、特定于公司的输出。然而,检索过程在准确性、可扩展性和安全性方面仍面临困难,特别是在处理复杂的企业内容时。

为了解决这些问题,Pryon推出了Pryon检索引擎,这是一个先进的平台,能够安全地从复杂而分散的内容中提取信息,使组织能够最大化利用当今的人工智能工具。Pryon总裁兼首席运营官Chris Mahl表示:“生成内容的可靠性值得怀疑,偏见是一个重大问题。一些模型实际上是固化在某个时刻。即使你提出了深刻的问题,其答案却可能来自过时的信息,这造成了实质性的问题。”

建立一致的知识库

当前的数据摄取方法在处理复杂文档内容时常常表现不佳,使得在规模上实现准确性变得困难。此外,内容通常分散在不同的系统和格式中。Pryon检索引擎通过将数百万条企业数据整合成一个统一的知识库,称为“集群”,克服了这些障碍。

该系统运用语义神经网络、文档分析和专有光学字符识别(OCR)技术,从图像、图形、表格甚至手写笔记中提取文本。此外,视频分割用于识别关键组件,规范内容,并应用视觉语义分割对文档进行分类。用户可以以多种格式提出问题,几毫秒内便可得到答案。Mahl将这一多层信息系统称为“知识网络”,强调其复杂度远超单纯的检索。

为了确保安全性,Pryon引入了访问控制列表(ACL)来定义用户访问权限。该系统还适用于本地、公有和私有云环境以及空气隔离设置。预构建组件使得组织可以在短短两周内实施生产就绪的生成AI应用,并且无代码接口允许实时内容更新。

该引擎具备API支持用于自定义部署,并与Microsoft SharePoint、Confluence、AWS S3、Google Drive、Zendesk、ServiceNow和Salesforce等平台无缝集成。Mahl表示:“所有专有信息——无论是复杂的原理图还是浩繁的报告——都被安全地提取到模型中,允许用户进行对话式互动,并获得准确、可归属的答案。”

行业应用示例

一位客户在本地使用Pryon,整合了40万个技术文件,5,000名用户仅需毫秒便可获取准确答案。在另一个案例中,一家消费电子游戏技术公司利用Pryon帮助数百万客户解答复杂的技术问题。该支持门户允许用户使用自然语言提问,并且每天更新多次。

同样,Pryon支持了一家工程公司,快速访问数百万个维护重要系统的文档。保险公司也整合了Pryon以提升其承保流程,而拥有复杂产品的企业则利用该引擎为销售团队提供即时知识。

Mahl指出:“检索数据层,RAG就绪数据层,是一家组织最重要的资产。因此,拥有一个安全、可扩展的基础设施来管理这些信息至关重要。”

处理企业中的分散数据

数据是组织价值的基础,但它们对数据的理解通常有限。数据存在多种形式——视频、长文本、电子邮件、财务文件甚至微缩胶卷——这使得确定关键信息变得困难。公司拥有大量复杂而高价值的数据,可以加速产品开发。然而,要为特定项目找到相关数据几乎是不可能的。例如,一家芯片工程公司可能在多个研究部门中拥有数百万份文件。

Mahl表示:“与知名企业合作并意识到其信息的碎片化是个启示。生成AI虽然已成为焦点,但由于组织内部的数据碎片化,它面临巨大的挑战。”他强调安全性的重要性,承认生成AI的兴奋之余也使人关注深层隐私和数据安全问题。预计生成AI每年将为全球经济带来高达4.4万亿美元的效益,但组织仍对将专有数据暴露给公共LLM和云存储表示谨慎。

Mahl强调:“我不断强调安全、安全、安全。这种安全控制水平是我们的指导原则之一。”

提升AI对问题理解的能力

为了提供准确的答案,AI必须首先理解问题的细微差别。Pryon的系统旨在理解询问的复杂性,考虑从标题到设计布局的一切。该引擎利用查询扩展、域外检测和查询嵌入技术来解读自然语言查询,采用三种专有模型识别和排名相关内容。

Mahl提到,个人在询问同一主题时会使用不同的方式。例如,“今年的收入比去年高多少?”与“去年的收入是多少?”相比,“一旦你拥有了有序的智能,准备准确地回应以多种方式提出的问题就变得至关重要。”这过程涉及审视潜在问题、评估内容并生成不同可能的询问。

确保AI响应的准确归属

确保响应归属对于防止模型“幻觉”或提供不正确的信息至关重要。Mahl承认:“虽然我们很多人都在使用ChatGPT和其他模型,但答案的来源往往不明确。”Pryon通过确保所有生成的答案来自可靠、规范的信息源来澄清这一点。这使用户能够提出多部分问题,响应则从多个来源提取,且均有清晰引用。

Mahl总结道:“Pryon的平台旨在赋能CIO、CTO和技术人员,使他们能够控制非结构化和半结构化的信息,以优化性能。”

Most people like

Find AI tools in YBX