Os modelos de linguagem de grande escala (LLMs) de hoje estão se tornando cada vez mais sofisticados. No entanto, os dados que eles utilizam para gerar respostas costumam permanecer estáticos, resultando em informações que podem estar desatualizadas por semanas ou até meses. Esse desafio torna a geração aumentada por recuperação (RAG) essencial para as empresas modernas, permitindo a produção de resultados atuais e específicos para cada organização. No entanto, os processos de recuperação podem enfrentar dificuldades com precisão, escalabilidade e segurança — especialmente ao lidar com conteúdos complexos de empresas.
Para resolver esses problemas, a Pryon apresentou o Pryon Retrieval Engine, uma plataforma avançada que extrai informações com segurança de conteúdos intricados e dispersos, permitindo que as organizações maximizem o potencial das ferramentas de IA atuais. “A confiabilidade do conteúdo gerado é questionável, e o viés é um problema significativo”, disse Chris Mahl, presidente e COO da Pryon. “Alguns modelos estão essencialmente congelados no tempo. Enquanto você pode fazer uma pergunta perspicaz, a resposta vem de informações desatualizadas, o que representa um problema substancial.”
Construindo uma Base de Conhecimento Consistente
Os métodos atuais de ingestão de dados muitas vezes falham com conteúdos complexos baseados em documentos, tornando a precisão difícil de alcançar em larga escala. Além disso, o conteúdo frequentemente está espalhado por diversos sistemas e formatos. O Pryon Retrieval Engine supera esses obstáculos integrando milhões de dados empresariais em uma única base de conhecimento coesa, chamada de “coleção”.
O sistema utiliza redes neurais semânticas, análise de documentos e um sistema proprietário de reconhecimento óptico de caracteres (OCR) para extrair texto de imagens, gráficos, tabelas e até mesmo notas manuscritas. Além disso, a segmentação de vídeo é utilizada para identificar componentes-chave, normalizar conteúdo e aplicar segmentação semântica visual para categorizar documentos. Os usuários podem fazer perguntas em vários formatos, recebendo respostas em apenas milissegundos. Mahl descreve esse sistema de informações em múltiplas camadas como uma “tela de conhecimento”, enfatizando sua complexidade além da simples recuperação.
Para garantir segurança, a Pryon incorpora listas de controle de acesso (ACL) para definir os direitos de acesso dos usuários. O sistema também é adaptável para implantação em ambientes locais, em nuvem pública e privada, assim como em configurações isoladas. Componentes pré-construídos permitem que as organizações implementem aplicações de IA generativa prontas para produção em apenas duas semanas, enquanto uma interface sem código permite atualizações de conteúdo em tempo real. O motor é habilitado para API para implantações personalizadas e integra-se perfeitamente a plataformas como Microsoft SharePoint, Confluence, AWS S3, Google Drive, Zendesk, ServiceNow e Salesforce.
“Todas as informações proprietárias — independentemente do formato, desde esquemas complicados a relatórios extensos — são extraídas com segurança para um modelo, permitindo que os usuários interajam de forma conversacional e obtenham respostas precisas e atribuíveis”, afirmou Mahl.
Aplicações em Diversas Indústrias
Um cliente utilizou o Pryon localmente para consolidar 400.000 documentos técnicos acessados por 5.000 usuários, fornecendo respostas precisas em milissegundos. Em outro caso, uma empresa de tecnologia de jogos utilizada por milhões de clientes recorreu ao Pryon para responder a consultas técnicas complexas em seu site de suporte, que é atualizado várias vezes ao dia. Da mesma forma, o Pryon apoiou uma empresa de engenharia ao fornecer acesso rápido a milhões de documentos críticos para a manutenção de sistemas vitais. Companhias de seguros também integraram o Pryon para aprimorar seus processos de subscrição, enquanto empresas com produtos complexos utilizam o motor para capacitar suas equipes de vendas com conhecimento imediato.
“A camada de dados de recuperação, a camada de dados pronta para RAG, é o ativo mais crucial de uma organização”, observou Mahl. “Portanto, ter uma infraestrutura segura e escalável para gerenciar essas informações é essencial.”
Navegando em Dados Fragmentados em Empresas
Os dados são a base de valor nas organizações, mas sua compreensão muitas vezes é limitada. Os dados existem em várias formas — vídeo, textos extensos, e-mails, documentos financeiros e até microfilmes — tornando difícil localizar informações cruciais. As empresas possuem grandes quantidades de dados complexos e valiosos que poderiam acelerar o desenvolvimento de produtos. No entanto, localizar dados relevantes para projetos específicos pode ser quase impossível. Por exemplo, uma empresa de engenharia de chips pode ter milhões de documentos espalhados por vários departamentos de pesquisa.
“Foi esclarecedor trabalhar com empresas de prestígio e perceber quão fragmentadas estão suas informações”, disse Mahl. “A IA generativa está agora em cena, mas enfrenta desafios consideráveis devido à fragmentação dos dados dentro das organizações.” Mahl enfatizou a importância da segurança, reconhecendo a empolgação em torno da IA generativa, mas alertando sobre as profundas preocupações com a privacidade e a segurança dos dados. Com a IA generativa projetada para gerar até US$ 4,4 trilhões em benefícios econômicos globais anualmente, as organizações continuam cautelosas em expor dados proprietários a LLMs públicos e à nuvem.
“Eu continuo enfatizando segurança, segurança, segurança”, destacou Mahl. “Este nível de controle de segurança é um de nossos princípios orientadores.”
Elevando a Compreensão das Perguntas em IA
Para fornecer respostas precisas, a IA deve primeiro compreender as nuances da pergunta. Os sistemas da Pryon são projetados para entender as complexidades das consultas, considerando tudo, desde cabeçalhos a layouts de design. O motor utiliza expansões de consultas, detecção fora do domínio e incorporação de consultas para interpretar perguntas em linguagem natural, empregando três modelos proprietários para identificar e classificar conteúdo relevante.
Mahl observou que as pessoas fazem perguntas sobre o mesmo tópico de várias maneiras. Por exemplo, “quanto a receita deste ano é maior do que a do ano passado?” em comparação com “qual foi a receita do ano passado?” “Uma vez que você tem inteligência organizada, se preparar para responder com precisão a uma pergunta feita de várias maneiras torna-se vital”, explicou Mahl. Este processo envolve examinar a pergunta subjacente, avaliar o conteúdo e gerar um conjunto diversificado de possíveis consultas.
Garantindo Atribuição Precisa nas Respostas da IA
A atribuição é crucial para evitar que os modelos “alucinem”, ou seja, forneçam informações incorretas. “Enquanto muitos de nós usamos o ChatGPT e outros modelos, pode ser confuso saber de onde vêm as respostas”, reconheceu Mahl. A Pryon esclarece isso garantindo que todas as respostas geradas sejam provenientes de fontes de informação confiáveis e canônicas. Isso permite que os usuários façam perguntas de múltiplas partes, com respostas extraídas de várias fontes, todas claramente referenciadas.
“A plataforma da Pryon é projetada para capacitar CIOs, CTOs e técnicos, dando-lhes controle sobre suas informações não estruturadas e semi-estruturadas para otimizar o desempenho”, concluiu Mahl.