Heutige große Sprachmodelle (LLMs) werden zunehmend komplexer. Allerdings bleibt die Datenbasis, auf der sie ihre Antworten generieren, oft statisch, was zu Informationen führt, die Wochen oder sogar Monate alt sein können. Diese Herausforderung macht die retrieval-augmented generation (RAG) für moderne Unternehmen unverzichtbar, da sie die Erstellung aktueller, unternehmensspezifischer Inhalte ermöglicht. Dennoch können Abrufprozesse hinsichtlich Genauigkeit, Skalierbarkeit und Sicherheit—insbesondere bei komplexen Unternehmensinhalten—mithalten.
Um diese Herausforderungen zu bewältigen, hat Pryon die Pryon Retrieval Engine eingeführt, eine fortschrittliche Plattform, die Informationen aus komplexen und verteilten Inhalten sicher extrahiert und es Organisationen ermöglicht, das Potenzial heutiger KI-Tools zu maximieren. "Die Zuverlässigkeit der generierten Inhalte ist fraglich, und Vorurteile sind ein erhebliches Problem", sagte Chris Mahl, Präsident und COO von Pryon. "Einige Modelle sind im Grunde eingefroren. Auch wenn Sie eine aufschlussreiche Frage stellen, stammen die Antworten aus veralteten Informationen, was ein erhebliches Problem darstellt."
Aufbau einer konsistenten Wissensbasis
Aktuelle Datenaufnahmemethoden stoßen häufig an ihre Grenzen, wenn es um komplexe, dokumentenbasierte Inhalte geht, wodurch die Genauigkeit schwer zu erreichen ist. Zudem ist der Inhalt häufig über verschiedene Systeme und Formate verstreut. Die Pryon Retrieval Engine überwindet diese Hindernisse, indem sie Millionen von Unternehmensdaten zu einer einheitlichen Wissensbasis integriert, die als "Sammlung" bezeichnet wird.
Das System nutzt semantische neuronale Netze, Dokumentenanalysen und proprietäre optische Zeichenerkennung (OCR), um Texte aus Bildern, Grafiken, Tabellen und sogar handgeschriebenen Notizen zu extrahieren. Auch die Video-Segmentierung wird verwendet, um Schlüsselkomponenten zu identifizieren, Inhalte zu normalisieren und eine visuelle semantische Segmentierung vorzunehmen, um Dokumente zu kategorisieren. Nutzer können Fragen in verschiedenen Formaten stellen und erhalten in nur wenigen Millisekunden Antworten. Mahl beschreibt dieses mehrschichtige Informationssystem als eine "Wissensstruktur" und betont seine Komplexität über das bloße Abrufen hinaus.
Um Sicherheit zu gewährleisten, integriert Pryon Zugriffssteuerungslisten (ACLs), um Benutzerzugriffsrechte festzulegen. Das System ist zudem anpassungsfähig für On-Premises-, öffentliche und private Cloud-Umgebungen sowie in isolierten Setups. Vorgefertigte Komponenten ermöglichen es Unternehmen, produktionstaugliche generative KI-Anwendungen in nur zwei Wochen zu implementieren, während eine No-Code-Schnittstelle Echtzeit-Inhaltsaktualisierungen ermöglicht. Die Engine ist API-fähig für maßgeschneiderte Implementierungen und integriert sich nahtlos mit Plattformen wie Microsoft SharePoint, Confluence, AWS S3, Google Drive, Zendesk, ServiceNow und Salesforce.
"Alle proprietären Informationen—unabhängig vom Format, von komplexen Diagrammen bis zu umfangreichen Berichten—werden sicher in ein Modell überführt, das es Nutzern ermöglicht, konversationell zu interagieren und genaue, nachvollziehbare Antworten zu erhalten", betonte Mahl.
Anwendungen in verschiedenen Branchen
Ein Kunde nutzte Pryon vor Ort, um 400.000 technische Dokumente für 5.000 Nutzer zu konsolidieren und dabei innerhalb von Millisekunden präzise Antworten zu liefern. In einem anderen Fall verwendete ein Verbraucher-Gaming-Technologieunternehmen Pryon, um Millionen von Kunden bei komplexen technischen Anfragen auf ihrer Support-Seite zu unterstützen. Dieses Portal erlaubt es Nutzern, Fragen in natürlicher Sprache zu stellen und wird mehrmals täglich aktualisiert.
Ebenso unterstützte Pryon ein Ingenieurbüro, indem es schnellen Zugriff auf Millionen von Dokumenten gewährte, die für die Aufrechterhaltung kritischer Systeme entscheidend sind. Versicherungsgesellschaften haben Pryon ebenfalls integriert, um ihre Underwriting-Prozesse zu verbessern, während Unternehmen mit komplexen Produkten die Engine nutzen, um ihre Vertriebsteams mit sofortigem Wissen zu unterstützen. "Die Retrieval-Datenebene, die RAG-fähige Datenebene, ist das wichtigste Gut eines Unternehmens", bemerkte Mahl. "Deshalb ist eine sichere, skalierbare Infrastruktur für das Management dieser Informationen unerlässlich."
Navigieren durch fragmentierte Daten in Unternehmen
Daten sind die Grundlage des Wertes in Organisationen, doch das Verständnis dafür ist oft begrenzt. Daten existieren in verschiedenen Formen—Videos, lange Texte, E-Mails, Finanzdokumente und sogar Mikrofiche—was es schwierig macht, entscheidende Informationen zu finden. Unternehmen verfügen über riesige Mengen komplexer, wertvoller Daten, die die Produktentwicklung beschleunigen könnten. Dennoch ist es nahezu unmöglich, relevante Daten für spezifische Projekte zu lokalisieren. Zum Beispiel könnte ein Chip-Engineering-Unternehmen Millionen von Dokumenten über mehrere Forschungsabteilungen verteilt haben.
"Es war aufschlussreich, mit namhaften Unternehmen zu arbeiten und zu erkennen, wie fragmentiert ihre Informationen sind", sagte Mahl. "Generative KI ist nun auf dem Markt, sieht sich jedoch erheblichen Herausforderungen aufgrund der Datenfragmentierung innerhalb von Organisationen gegenüber." Mahl betonte die Bedeutung von Sicherheit und räumte ein, dass die Aufregung rund um generative KI auch tiefgreifende Bedenken hinsichtlich Datenschutz und Datensicherheit mit sich bringt. Da erwartet wird, dass generative KI jährlich bis zu 4,4 Billionen Dollar an globalen wirtschaftlichen Vorteilen generiert, bleiben Organisationen vorsichtig, wenn es darum geht, proprietäre Daten öffentlichen LLMs und der Cloud auszusetzen. "Ich betone ständig Sicherheit, Sicherheit, Sicherheit", unterstrich Mahl. "Dieses Maß an Sicherheitskontrolle ist eines unserer Leitprinzipien."
Verbesserung des Frageverständnisses in KI
Um präzise Antworten zu geben, muss KI zunächst die Nuancen der Fragen erfassen. Pryons Systeme sind so gestaltet, dass sie die Feinheiten von Anfragen verstehen und alles berücksichtigen—von Überschriften bis hin zu Layouts. Die Engine verwendet Anfragen-Erweiterungen, Erkennung von außer-Range-Anfragen und Anfragen-Einbettung, um natürliche Sprachabfragen zu interpretieren, und nutzt dabei drei proprietäre Modelle zur Identifikation und Rangierung relevanter Inhalte.
Mahl weist darauf hin, dass Personen zu demselben Thema auf unterschiedliche Weise Fragen stellen. Zum Beispiel, "Wie viel höher ist der Umsatz in diesem Jahr im Vergleich zum letzten Jahr?" im Vergleich zu "Wie hoch war der Umsatz im letzten Jahr?" "Sobald Sie organisierte Intelligenz haben, wird es wichtig, sich darauf vorzubereiten, genau auf eine Frage zu antworten, die auf verschiedene Weise gestellt wird", erklärte Mahl. Dieser Prozess beinhaltet die Untersuchung der zugrundeliegenden Frage, die Bewertung der Inhalte und die Generierung einer vielfältigen Menge möglicher Anfragen.
Sicherstellung einer genauen Zuordnung von KI-Antworten
Die Zuordnung ist entscheidend, um zu verhindern, dass Modelle "halluzinieren", also falsche Informationen liefern. "Während viele von uns ChatGPT und andere Modelle nutzen, kann es unklar sein, woher die Antworten stammen", räumte Mahl ein. Pryon klärt dies, indem es sicherstellt, dass alle generierten Antworten auf zuverlässigen, kanonischen Informationsquellen beruhen. Dies ermöglicht es Nutzern, mehrteilige Fragen zu stellen, wobei die Antworten aus verschiedenen Quellen stammen, die alle klar referenziert werden.
"Pryons Plattform ist darauf ausgelegt, CIOs, CTOs und Technikern die Kontrolle über ihre unstrukturierten und semi-strukturierten Informationen zu geben, um die Leistung zu optimieren", schloss Mahl.