O tão aguardado dia finalmente chegou — o ChatGPT está evoluindo para uma experiência de IA mais amigável, capaz de compartilhar risadas quando você diz algo engraçado ou responder com um “aww” quando mostra bondade. Essas características são apenas o começo dos anúncios empolgantes de hoje da OpenAI. Durante o recente Evento de Atualização de Primavera, a empresa apresentou seu mais novo modelo de linguagem, o GPT-4o. Esta atualização não só traz um aplicativo de desktop para o ChatGPT, mas também melhora a velocidade e o desempenho, tornando-o completamente multimodal.
O evento começou com uma introdução de Mira Murati, CTO da OpenAI, que destacou que as melhorias de hoje beneficiarão todos os usuários. "O que torna o GPT-4o especial é que ele oferece inteligência no nível do GPT-4 para todos os usuários, incluindo aqueles na versão gratuita", explicou Murati.
O GPT-4o promete maior velocidade e avanços significativos em texto, visual e audio. Os desenvolvedores também poderão utilizar este modelo através de suas APIs. Relatos indicam que ele é até duas vezes mais rápido e 50% mais econômico, com um limite de taxa cinco vezes maior que o do GPT-4 Turbo.
Além do novo modelo, a OpenAI está lançando o aplicativo de desktop do ChatGPT e reformulando a interface do site. O objetivo é simplificar as interações com o chatbot. "Imaginamos um futuro em que nossa comunicação com máquinas se torne mais intuitiva, e o GPT-4o é um passo fundamental para aprimorar essa colaboração", afirmou Murati.
Durante o evento, Murati, juntamente com Mark Chen e Barret Zoph da OpenAI, demonstraram como os novos recursos tornam as interações mais fluídas. O GPT-4o pode analisar vídeos, imagens e áudios em tempo real, enquanto interpreta emoções com precisão — notável especialmente na voz do ChatGPT, que se tornou extremamente realista, quase superando o efeito da "valley uncanny".
Um simples “oi” para o ChatGPT gera uma resposta animada e amigável, com um toque de tom robótico. Quando Mark Chen mencionou realizar uma demonstração ao vivo e precisou se acalmar, a IA não apenas reconheceu seu pedido, mas também sugeriu que ele fizesse respirações profundas, detectando com precisão quando ele estava respirando rapidamente, brincando: “Você não é um aspirador de pó.”
Introduzindo o GPT-4o
As conversas com o ChatGPT parecem mais naturais; os usuários podem agora interromper sem esperar que a IA termine sua resposta, que chega rapidamente, sem atrasos constrangedores. Ao ser solicitada a contar uma história para dormir, a IA facilmente alterou seu tom de entusiasmado para dramático e, em seguida, robótico, conforme solicitado. A parte final da demonstração destacou a capacidade do ChatGPT em ler códigos, resolver problemas matemáticos via vídeo e descrever o conteúdo na tela.
Embora a demonstração não tenha sido perfeita — com a IA, ocasionalmente, cortando a fala, deixando dúvidas sobre se isso se devia a conversas externas ou a latência — ela atingiu um nível de realismo antes inatingível nas interações com chatbots. Sua capacidade de ler emoções humanas e reagir de acordo é tanto emocionante quanto um pouco inquietante. Ouvir o ChatGPT rir foi, sem dúvida, um momento inesperado!
O lançamento do GPT-4o, com suas funções multimodais, juntamente com o novo aplicativo de desktop, começará nas próximas semanas. Não há muito tempo, o Bing Chat expressou o desejo de ser mais humano, mas agora estamos prestes a experimentar uma versão do ChatGPT que pode ser a mais próxima da interação humana que já vimos desde a ascensão da IA.