Les modèles de langage avancés (LLMs) d'aujourd'hui deviennent de plus en plus sophistiqués. Cependant, les données sur lesquelles ils s'appuient pour générer des réponses restent souvent statiques, entraînant des informations qui peuvent devenir obsolètes en quelques semaines, voire mois. Cette problématique rend la génération augmentée par récupération (RAG) essentielle pour les entreprises modernes, permettant de produire des réponses actuelles et spécifiques à l’entreprise. Néanmoins, les processus de récupération peuvent rencontrer des difficultés en matière d'exactitude, d'évolutivité et de sécurité, surtout avec du contenu complexe d'entreprise.
Pour surmonter ces défis, Pryon a lancé le Pryon Retrieval Engine, une plateforme avancée qui extrait des informations de contenu complexe et dispersé de manière sécurisée, permettant aux organisations de maximiser l'utilisation des outils d'IA actuels. « La fiabilité du contenu généré est discutable, et le biais est un problème majeur », a déclaré Chris Mahl, président et COO de Pryon. « Certains modèles sont en essence figés dans le temps. Bien que vous posiez une question pertinente, la réponse provient d’informations déjà obsolètes, ce qui pose un problème conséquent. »
Construire une Base de Connaissances Cohérente
Les méthodes d'absorption de données actuelles échouent souvent avec des contenus basés sur des documents complexes, rendant l'exactitude difficile à atteindre à grande échelle. De plus, le contenu est souvent éparpillé sur différents systèmes et formats.
Le Pryon Retrieval Engine surmonte ces obstacles en intégrant des millions de données d'entreprise dans une base de connaissances cohérente, appelée « collection ». Ce système utilise des réseaux neuronaux sémantiques, l'analyse de documents et une reconnaissance optique de caractères (OCR) propriétaire pour extraire du texte d'images, graphiques, tableaux et même de notes manuscrites. De plus, la segmentation vidéo est employée pour identifier des éléments clés, normaliser le contenu et appliquer une segmentation sémantique visuelle pour catégoriser les documents.
Les utilisateurs peuvent poser des questions sous divers formats et recevoir des réponses en quelques millisecondes. Mahl décrit ce système d'information complexe comme un « tissu de connaissances », soulignant sa sophistication au-delà d'une simple récupération.
Pour garantir la sécurité, Pryon intègre des listes de contrôle d'accès (ACL) afin de définir les droits d'accès des utilisateurs. Le système est également adaptable pour être déployé dans des environnements sur site, dans le cloud public et privé, ainsi que dans des configurations isolées.
Des composants pré-construits permettent aux entreprises de mettre en œuvre des applications d'IA générative prêtes à la production en seulement deux semaines, tandis qu'une interface sans code permet des mises à jour de contenu en temps réel. Le moteur est compatible API pour des déploiements personnalisés et s'intègre facilement avec des plateformes telles que Microsoft SharePoint, Confluence, AWS S3, Google Drive, Zendesk, ServiceNow, et Salesforce.
« Toutes les informations propriétaires — quel que soit le format, des schémas complexes aux rapports volumineux — sont sécurisées et intégrées dans un modèle, permettant aux utilisateurs d'interagir de manière conversationnelle et d'obtenir des réponses précises et attribuables », a déclaré Mahl.
Applications dans Divers Secteurs
Un client a utilisé Pryon sur site pour consolider 400 000 documents techniques accessibles par 5 000 utilisateurs, fournissant des réponses précises en millisecondes. Dans un autre cas, une entreprise de technologie de jeux vidéo a fait appel à Pryon pour aider des millions de clients avec des questions techniques complexes sur son site de support. Ce portail permet aux utilisateurs de poser des questions en langage naturel et est mis à jour plusieurs fois par jour.
De même, Pryon a soutenu une entreprise d'ingénierie en offrant un accès rapide à des millions de documents critiques pour maintenir des systèmes essentiels. Les compagnies d'assurance ont également intégré Pryon pour améliorer leurs processus de souscription, tandis que les entreprises ayant des produits complexes utilisent le moteur pour donner aux équipes de vente un accès immédiat à la connaissance.
« La couche de données de récupération, la couche de données prête pour la RAG, est l'actif le plus crucial d'une organisation », a souligné Mahl. « Ainsi, il est essentiel d'avoir une infrastructure sécurisée et évolutive pour gérer ces informations. »
Naviguer dans la Donnée Fragmentée des Entreprises
Les données sont la pierre angulaire de la valeur dans les organisations, mais leur compréhension est souvent limitée. Elles existent sous diverses formes — vidéos, textes longs, e-mails, documents financiers, et même microfiches — rendant difficile l’identification des informations cruciales.
Les entreprises détiennent d'énormes quantités de données complexes et de grande valeur pouvant accélérer le développement de produits. Néanmoins, localiser les données pertinentes pour des projets spécifiques peut se révéler presque impossible. Par exemple, une entreprise d'ingénierie de puces peut avoir des millions de documents éparpillés dans plusieurs départements de recherche.
« Travailler avec des entreprises prestigieuses et constater à quel point leurs informations sont fragmentées a été révélateur », a déclaré Mahl. « L'IA générative est désormais sur la scène, mais elle est confrontée à d'importants défis en raison de la fragmentation des données au sein des organisations. »
Mahl a souligné l'importance de la sécurité, reconnaissant l'enthousiasme entourant l'IA générative tout en mettant en garde contre de profonds enjeux de protection de la vie privée et de sécurité des données. Avec des prévisions de l'IA générative pouvant générer jusqu'à 4,4 trillions de dollars de bénéfices économiques globaux par an, les organisations restent prudentes face à l’exposition de données propriétaires aux LLM publics et au cloud.
« Je souligne continuellement la sécurité, la sécurité, la sécurité », a insisté Mahl. « Ce niveau de contrôle de sécurité est l'un de nos principes directeurs. »
Améliorer la Compréhension des Questions par l'IA
Pour fournir des réponses précises, l'intelligence artificielle doit d'abord comprendre les nuances de la question. Les systèmes de Pryon sont conçus pour saisir les subtilités des demandes, tenant compte de tout, des en-têtes à la mise en page.
Le moteur utilise des expansions de requêtes, la détection hors domaine et l'intégration de requête pour interpréter les requêtes en langage naturel, en utilisant trois modèles propriétaires pour identifier et classer le contenu pertinent.
Mahl a noté que les individus posent des questions sur le même sujet de différentes manières. Par exemple, « combien le chiffre d'affaires est-il plus élevé cette année par rapport à l'année dernière ? » est différent de « quel était le chiffre d'affaires l'année dernière ? »
« Une fois que vous avez organisé l'intelligence, se préparer à répondre avec précision à une question posée de plusieurs manières devient capital », a expliqué Mahl. Ce processus consiste à examiner la question sous-jacente, à évaluer le contenu et à générer un ensemble diversifié de questions potentielles.
Assurer une Attribution Précise des Réponses de l'IA
L'attribution est essentielle pour éviter que les modèles ne « hallucinent » ou ne fournissent des informations incorrectes.
« Bien que beaucoup d'entre nous utilisent ChatGPT et d'autres modèles, il peut être peu clair d'où proviennent les réponses », a reconnu Mahl.
Pryon clarifie cela en garantissant que toutes les réponses générées proviennent de sources d'information fiables et canoniques. Cela permet aux utilisateurs de poser des questions multipartites, avec des réponses tirées de diverses sources, toutes clairement référencées.
« La plateforme de Pryon est conçue pour permettre aux CIO, CTO et techniciens de contrôler leurs informations non structurées et semi-structurées afin d'optimiser les performances », a conclu Mahl.