A IBM Busca Ensinar a IA a Linguagem do Seu Negócio para Uma Compreensão Aprimorada

No VB Transform 2024, David Cox, da IBM, defendiu a importância da inovação aberta na IA generativa empresarial, destacando a dedicação histórica da empresa às tecnologias de código aberto. Como Vice-presidente de Modelos de IA e Diretor do MIT-IBM Watson AI Lab, Cox apresentou uma visão que desafia e inspira o setor de tecnologia.

"A inovação aberta é realmente a história do progresso humano", afirmou Cox, enfatizando que esse conceito é crucial para o avanço tecnológico. Ele sublinhou a importância do momento atual no desenvolvimento da IA: "Precisamos decidir onde investir e como evitar o lock-in."

Cox questionou a percepção simplista da abertura na IA, dizendo: "Aberto não é apenas uma coisa. Envolve muitos significados." Ele destacou o ecossistema emergente de modelos abertos de várias fontes, incluindo grandes empresas de tecnologia, universidades e até governos.

No entanto, expressou preocupações sobre a qualidade da abertura em muitos grandes modelos de linguagem (LLMs). "Em algumas situações, você é apresentado apenas a um conjunto de números, sem saber como foram produzidos", alertou. Essa falta de transparência, segundo ele, complica a reprodutibilidade e compromete princípios essenciais do código aberto.

Cox fez uma analogia com o software de código aberto tradicional, ressaltando características que contribuíram para seu sucesso: atualizações frequentes, ciclos de lançamento estruturados, correções de segurança e contribuições ativas da comunidade. "Tudo é bem definido, permitindo contribuições incrementais de empresas e da comunidade em geral", observou.

Ele criticou o estado atual dos LLMs abertos, afirmando: "Apesar de impressionantes, muitas vezes faltam atributos fundamentais do código aberto." Cox apontou os cronogramas de lançamento inconsistentes de alguns provedores, com modelos às vezes não recebendo atualizações após o lançamento inicial. Essa inconsistência, de acordo com Cox, mina a verdadeira essência do código aberto e limita a inovação impulsionada pela comunidade na IA.

Cox enfatizou o compromisso da IBM com a transparência por meio da série Granite de modelos de IA de código aberto. "Divulgamos tudo sobre o modelo", afirmou, destacando que tornaram públicos todos os códigos de processamento para garantir qualidade e filtragem de conteúdos questionáveis.

Cox argumentou que esse nível de abertura não compromete o desempenho. Apresentou benchmarks mostrando que os modelos Granite são de última geração, afirmando: "Você não precisa sacrificar a transparência por um desempenho superior."

Ele ofereceu uma nova perspectiva sobre os LLMs, enquadrando-os como representações de dados em vez de apenas ferramentas de conversa. Com estimativas indicando que os LLMs em breve abrangerão quase todos os dados disponíveis publicamente, Cox notou uma lacuna significativa: o conhecimento proprietário das empresas está amplamente ausente nesses modelos.

Para resolver isso, propôs a missão de incorporar dados empresariais em modelos fundamentais para desbloquear seu potencial total. Embora técnicas como geração aumentada por recuperação (RAG) existam, Cox argumentou que muitas vezes não aproveitam o conhecimento único e a informação proprietária das empresas.

Cox esboçou uma abordagem em três etapas para as empresas: identificar um modelo base aberto confiável, criar uma nova representação dos dados empresariais e, em seguida, implantar e escalar para a criação de valor. Ele enfatizou a necessidade de transparência na seleção de um modelo base, especialmente em indústrias regulamentadas, observando que muitos provedores de modelos não divulgam seus dados.

O desafio está em fundir efetivamente os dados proprietários com o modelo base. Cox argumentou que o modelo base escolhido deve ser de alto desempenho, transparente e de código aberto para proporcionar o controle e a flexibilidade necessários para as empresas.

Para trazer sua visão à vida, Cox apresentou o InstructLab, uma iniciativa conjunta entre a IBM e a Red Hat, projetada para integrar o conhecimento empresarial em modelos de IA. "O InstructLab permite contribuições genuínas de código aberto para os LLMs", explicou.

O projeto emprega uma taxonomia estruturada de conhecimento e habilidades do mundo, permitindo que os usuários melhorem o desempenho do modelo de forma precisa. Essa abordagem estruturada facilita a integração de percepções específicas da empresa, diminuindo as barreiras para especialistas do domínio personalizarem modelos.

O InstructLab utiliza um modelo "professor" para gerar dados de treinamento sintéticos, mesclando de forma suave dados proprietários com modelos base, sem sacrificar o desempenho. Notavelmente, acelera o ciclo de atualização do modelo para apenas um dia, em contraste com os longos ciclos de lançamento tradicionais.

As percepções de Cox e o InstructLab da IBM sinalizam uma mudança na adoção de IA empresarial, movendo-se de modelos genéricos para soluções personalizadas que refletem a expertise única de cada empresa. À medida que a tecnologia evolui, a vantagem competitiva pode depender de transformar efetivamente o conhecimento institucional em insights impulsionados por IA. O próximo capítulo da IA não se trata apenas de máquinas mais inteligentes; trata-se de máquinas que entendem os negócios tão intimamente quanto seus usuários.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles