Pesquisadores da Apple Revelam um Sistema de IA Inovador: Inovações que Superam o Desempenho do GPT-4

Home Notícias de IA Pesquisadores da Apple Revelam um Sistema de IA Inovador: Inovações que Superam o Desempenho do GPT-4

Pesquisadores da Apple desenvolveram um sistema de IA chamado ReALM (Resolução de Referência como Modelagem de Linguagem) com o objetivo de aprimorar significativamente a capacidade dos assistentes de voz em compreender e responder a comandos.

No seu mais recente artigo de pesquisa, a Apple descreve como o ReALM utiliza grandes modelos de linguagem para enfrentar os desafios da resolução de referência. Este sistema se destaca na interpretação de referências vagas a entidades na tela e na compreensão do diálogo em contexto, tornando as interações com dispositivos mais intuitivas e naturais.

A resolução de referência é um aspecto crucial da compreensão da linguagem natural, permitindo que os usuários utilizem pronomes e referências indiretas nas conversas sem gerar confusão. No entanto, isso tem sido um desafio significativo para assistentes digitais devido à complexidade de processar diversos indícios verbais e informações visuais. O ReALM busca simplificar esse processo intricado em uma tarefa básica de modelagem de linguagem, permitindo uma melhor compreensão das referências a elementos visuais na tela durante as conversas.

O ReALM reconstrói o layout visual da tela por meio de uma representação textual, analisando as entidades na tela e suas localizações para gerar um formato textual que reflete o conteúdo e a estrutura da tela. Os pesquisadores da Apple descobriram que modelos de linguagem especialmente ajustados apresentaram desempenho significativamente superior em tarefas de resolução de referência em comparação com métodos tradicionais, incluindo o GPT-4 da OpenAI.

Esse avanço permite que os usuários interajam de forma mais eficiente com assistentes digitais, com base no conteúdo exibido nas suas telas, eliminando a necessidade de descrições precisas e detalhadas. Isso abre um maior potencial para aplicações de assistentes de voz, como ajudar motoristas com informações de navegação enquanto dirigem ou oferecer interações indiretas mais simples e precisas para usuários com deficiências.

Recentemente, a Apple lançou vários estudos relacionados à inteligência artificial, notavelmente um método de treinamento de modelo de linguagem de grande escala para integrar de forma fluida informações textuais e visuais, publicado no mês passado. A expectativa está crescendo para a próxima conferência WWDC em junho, onde a Apple deverá revelar uma gama de novos recursos de IA.

Aumento de Investimentos em IA Generativa: EUA Lideram Globalmente, Enquanto a China se Destaca em Registro de Patentes

Parceria Estratégica de IA da Apple: Baidu Apresentará Recursos Inovadores de IA para o iPhone 16 na China

Most people like

Chatfuel

377.6K

O Chatfuel, reconhecido como parceiro oficial da API do WhatsApp, oferece uma plataforma de mensagens poderosa, projetada para uma comunicação empresarial eficaz. Desbloqueie o potencial de interações simplificadas com os clientes e aumente o engajamento da sua marca por meio desta solução inovadora.

Chatfuel AI Chatbot

Kombai

55.7K

Kombai é uma ferramenta inovadora impulsionada por IA, projetada para transformar de forma impecável os designs do Figma em código front-end preciso. Experimente o futuro da conversão de design para código com precisão e eficiência incomparáveis.

Conversão de Figma para código AI Code Assistant

SocialBu - Social Media Management and Automation

385.6K

SocialBu é uma ferramenta poderosa projetada para simplificar e automatizar a gestão das suas redes sociais em várias plataformas.

gerenciamento de mídias sociais AI Social Media Assistant

CapMonster Cloud

338.4K

Apresentando o CapMonster Cloud: um serviço avançado de resolução de CAPTCHA movido por IA que otimiza a automação na solução de uma ampla variedade de CAPTCHAs, incluindo reCAPTCHA, hCaptcha e outros. Com sua tecnologia inovadora, o CapMonster Cloud melhora a eficiência e a experiência do usuário na navegação em plataformas online.

Raspagem de dados na web AI Image Recognition

Find AI tools in YBX