Na era da IA generativa, os chatbots se tornaram mais prevalentes do que nunca—mas será que realmente são mais úteis e precisos? Hoje, a Vectara, uma plataforma para construção de IA generativa, apresentou um novo módulo projetado para capacitar empresas a criar e implementar chatbots altamente precisos. Utilizando um método de Geração Aumentada por Recuperação (RAG) combinado com embeddings vetoriais Boomerang, a Vectara garante a entrega de informações em tempo real, minimizando o risco de alucinações. Desde sua saída do modo stealth em outubro de 2022, a Vectara tem aprimorado progressivamente sua plataforma para atender às necessidades dos usuários, e a introdução deste módulo de chat representa uma extensão significativa de suas capacidades.
“Quando você usa nossa funcionalidade de chat, ela aproveita o RAG para gerar suas respostas,” afirmou Tallat Shafaat, cofundador e Arquiteto Chefe da Vectara. “As respostas vêm dos seus próprios documentos, melhorando a precisão.”
Chatbots Modernos: Além de Q&A para IA Conversacional
O que diferencia o novo módulo de Chat da Vectara de suas ofertas anteriores? Segundo Amr Awadallah, cofundador e CEO da Vectara, a chave está na escalabilidade e na persistência da conversa. Historicamente, a API da Vectara se concentrava principalmente em interações de perguntas e respostas, onde os usuários faziam uma pergunta e recebiam uma resposta. Se houvesse perguntas adicionais, os usuários precisavam reformular sua consulta original devido à abordagem sem estado da Vectara, que não retinha o histórico da conversa. Essa limitação frequentemente exigia que os clientes construíssem suas próprias camadas de persistência para conversas com estado. No entanto, o novo módulo de Chat da Vectara altera isso ao integrar memória persistente, permitindo que a plataforma acompanhe o histórico das conversas de forma fluida. “Esta nova extensão permite que nossa API mantenha o histórico da conversa, eliminando a necessidade de reformular consultas anteriores,” afirmou Awadallah.
Para a implementação, a Vectara oferece tanto uma API quanto widgets simples, permitindo que as organizações integrem facilmente o módulo de chat em seus sites ou aplicativos com apenas algumas linhas de JavaScript e HTML.
Olhando para o futuro, Shafaat mencionou planos para aprimorar o Vectara Chat com recursos adicionais de gerenciamento empresarial. Os proprietários de contas poderão analisar os históricos de chat dos clientes semanticamente, obtendo insights sobre sentimentos dos usuários e tendências de consulta. A funcionalidade de consulta baseada em RAG também facilitará investigações sobre os chats dos usuários.
Abordando Alucinações e Viés na IA Generativa
Um desafio significativo na utilização de IA generativa em empresas é o risco de alucinações. A abordagem RAG da Vectara é uma das várias estratégias projetadas para mitigar a probabilidade de respostas imprecisas em seu módulo de chat. Awadallah enfatizou que o sistema da Vectara oferece respostas explicáveis com citações, aumentando a precisão. A plataforma também incorpora mitigação de viés por meio de uma abordagem pioneira conhecida como relevância marginal máxima. “A relevância marginal máxima aumenta a diversidade dos resultados que retornamos,” explicou.
Awadallah acrescentou que, para tópicos debatíveis com opiniões variadas, um algoritmo robusto é crucial para apresentar múltiplas perspectivas. “Nós garantimos que capturamos as opiniões principais, bem como as secundárias, mesmo que sejam menos relevantes,” afirmou.
Ao focar em precisão, diversidade e engajamento do usuário, a Vectara visa elevar o papel dos chatbots na comunicação empresarial.