Los modelos de lenguaje grande (LLMs) de hoy en día están volviéndose cada vez más sofisticados. Sin embargo, los datos en los que se basan para generar respuestas a menudo permanecen estáticos, lo que puede resultar en información obsoleta por semanas o incluso meses. Este desafío ha hecho que la generación aumentada por recuperación (RAG) sea crucial para las empresas modernas, permitiendo la creación de salidas específicas y actualizadas para cada organización. No obstante, los procesos de recuperación pueden enfrentar problemas de precisión, escalabilidad y seguridad, especialmente al tratar con contenido complejo de empresas.
Para abordar estos retos, Pryon ha presentado el Pryon Retrieval Engine, una plataforma avanzada que extrae información de manera segura de contenidos intrincados y dispersos, permitiendo a las organizaciones maximizar el potencial de las herramientas de IA actuales. “La fiabilidad del contenido generado es cuestionable, y el sesgo es un problema significativo,” comentó Chris Mahl, presidente y COO de Pryon. “Algunos modelos están esencialmente congelados en el tiempo. Aunque puedas hacer una pregunta perspicaz, la respuesta proviene de información desactualizada, lo que representa un problema considerable.”
Construyendo una Base de Conocimiento Consistente
Los métodos actuales de ingestión de datos a menudo fallan con contenidos documentales complejos, dificultando la consecución de precisión a gran escala. Además, el contenido suele estar disperso en varios sistemas y formatos. El Pryon Retrieval Engine supera estos obstáculos integrando millones de piezas de datos empresariales en una base de conocimiento cohesiva, denominada “colección.”
El sistema utiliza redes neuronales semánticas, análisis de documentos y un reconocimiento óptico de caracteres (OCR) propietario para extraer texto de imágenes, gráficos, tablas e incluso notas manuscritas. Además, se utiliza segmentación de video para identificar componentes clave, normalizar contenido y aplicar segmentación semántica visual para clasificar documentos. Los usuarios pueden formular preguntas en diversos formatos, recibiendo respuestas en milisegundos. Mahl describe este sistema de información como un “tejido de conocimiento,” enfatizando su complejidad más allá de la simple recuperación.
Para garantizar la seguridad, Pryon incorpora listas de control de acceso (ACL) para definir los derechos de acceso de los usuarios. El sistema también es adaptable para implementaciones en entornos locales, en la nube pública y privada, así como en configuraciones aisladas. Componentes preconstruidos permiten a las organizaciones implementar aplicaciones de IA generativas listas para producción en tan solo dos semanas, mientras que una interfaz sin código permite actualizaciones de contenido en tiempo real. El motor es habilitado por API para despliegues personalizados e integra sin esfuerzo plataformas como Microsoft SharePoint, Confluence, AWS S3, Google Drive, Zendesk, ServiceNow y Salesforce.
“Cualquier información propietaria — independientemente del formato, desde esquemas complicados hasta informes extensos — se extrae de manera segura en un modelo, permitiendo a los usuarios interactuar de forma conversacional y obtener respuestas precisas y atribuibles,” afirmó Mahl.
Aplicaciones en Diversas Industrias
Un cliente utilizó Pryon de forma local para consolidar 400,000 documentos técnicos accesibles por 5,000 usuarios, proporcionando respuestas precisas en milisegundos. En otro caso, una empresa de tecnología de juegos asistió a millones de clientes con consultas técnicas complejas en su sitio de soporte gracias a Pryon. Este portal permite a los usuarios formular preguntas en lenguaje natural y se actualiza múltiples veces al día.
Del mismo modo, Pryon apoyó a una firma de ingeniería al brindar acceso rápido a millones de documentos críticos para el mantenimiento de sistemas vitales. Las compañías de seguros también han integrado Pryon para mejorar sus procesos de suscripción, mientras que las empresas con productos intrincados utilizan el motor para capacitar a sus equipos de ventas con conocimiento inmediato. “La capa de datos de recuperación, la capa de datos lista para RAG, es el activo más crucial de una organización,” observó Mahl. “Por lo tanto, tener una infraestructura segura y escalable para gestionar esta información es esencial.”
Navegando Datos Fragmentados en las Empresas
Los datos son la base del valor en las organizaciones, pero su comprensión a menudo es limitada. Los datos existen en diversas formas — video, textos extensos, correos electrónicos, documentos financieros e incluso microfichas — lo que dificulta la localización de información crucial. Las empresas poseen enormes cantidades de datos complejos y de alto valor que podrían acelerar el desarrollo de productos. Sin embargo, localizar datos relevantes para proyectos específicos puede ser casi imposible. Por ejemplo, una firma de ingeniería de chips puede tener millones de documentos repartidos entre varios departamentos de investigación.
“Ha sido revelador trabajar con empresas prestigiosas y darse cuenta de lo fragmentada que está su información,” dijo Mahl. “La IA generativa ya está aquí, pero enfrenta considerables desafíos debido a la fragmentación de datos dentro de las organizaciones.” Mahl enfatizó la importancia de la seguridad, reconociendo la emoción que rodea a la IA generativa al tiempo que advirtió sobre las profundas preocupaciones de privacidad y seguridad de datos. Con la IA generativa proyectada para generar hasta $4.4 billones en beneficios económicos globales anuales, las organizaciones siguen cautelosas ante la posibilidad de exponer datos propietarios a LLMs públicos y a la nube. “Enfatizo constantemente la seguridad, la seguridad, la seguridad,” subrayó Mahl. “Este nivel de control de seguridad es uno de nuestros principios rectores.”
Elevando la Comprensión de Preguntas en la IA
Para proporcionar respuestas precisas, la IA debe comprender primero las sutilezas de la pregunta. Los sistemas de Pryon están diseñados para entender las complejidades de las consultas, considerando desde los encabezados hasta el diseño. El motor utiliza expansiones de consultas, detección fuera de dominio y embedding de consultas para interpretar preguntas en lenguaje natural, utilizando tres modelos propietarios para identificar y clasificar contenido relevante.
Mahl señaló que las personas preguntan sobre el mismo tema de diversas maneras. Por ejemplo, “¿cuánto más alto es el ingreso este año que el pasado?” comparado con “¿cuál fue el ingreso el año pasado?” “Una vez que tienes una inteligencia organizada, prepararte para responder de manera precisa a una pregunta formulada de múltiples maneras se vuelve vital,” explicó Mahl. Este proceso implica examinar la pregunta subyacente, evaluar el contenido y generar un conjunto diverso de posibles consultas.
Asegurando una Atribución Precisa de Respuestas de IA
La atribución es fundamental para prevenir que los modelos "alucinen", es decir, proporcionen información incorrecta. “Si bien muchos de nosotros usamos ChatGPT y otros modelos, puede ser poco claro de dónde provienen las respuestas,” reconoció Mahl. Pryon aclara esto asegurando que todas las respuestas generadas provienen de fuentes de información confiables y canónicas. Esto permite a los usuarios realizar preguntas en múltiples partes, con respuestas extraídas de diversas fuentes, todas claramente referenciadas.
“La plataforma de Pryon está diseñada para empoderar a CIOs, CTOs y técnicos, dándoles control sobre su información no estructurada y semi-estructurada para optimizar el rendimiento,” concluyó Mahl.