O lançamento do ChatGPT fascinou os usuários com suas impressionantes capacidades de linguagem natural, baseando-se no modelo de linguagem GPT-3.5 anteriormente estabelecido. No entanto, a chegada do tão aguardado GPT-4 transformou as expectativas em relação à IA, sendo reconhecido como uma visão inicial da inteligência geral artificial (AGI).
O que é o GPT-4?
O GPT-4 é o mais recente modelo de linguagem da OpenAI, capaz de gerar textos que se assemelham à fala humana. Este modelo aprimora a tecnologia do ChatGPT, passando do GPT-3.5 para um sistema mais avançado. "Generative Pre-trained Transformer", ou GPT, refere-se à arquitetura de aprendizado profundo que utiliza redes neurais artificiais para emular a escrita humana.
A OpenAI destaca que o GPT-4 supera o ChatGPT em três áreas cruciais: criatividade, entrada visual e gerenciamento de contextos mais longos. Em termos de criatividade, o GPT-4 se destaca na geração e colaboração em projetos de diversos formatos, incluindo música, roteiros e escrita técnica, adaptando-se também ao estilo único do usuário.
A capacidade de processar contextos mais longos é significativa. O GPT-4 pode lidar com até 128.000 tokens de entrada e pode interagir com textos de links da web, ampliando suas capacidades de produção de conteúdo longo e sustento de conversas prolongadas. Além disso, o GPT-4 tem a habilidade de processar imagens, respondendo a estímulos visuais. Por exemplo, ele pode analisar uma foto de ingredientes para assar e sugerir receitas com base no que vê. Contudo, ainda não está claro se a entrada de vídeo é suportada da mesma forma.
Importante, o GPT-4 foi projetado para melhorar a segurança consideravelmente em comparação ao seu antecessor. Internamente, ele fornece 40% mais respostas factuais e tem 82% menos chance de interagir com solicitações de conteúdo proibido. Esse avanço é resultado de um extenso treinamento que incorpora feedback humano e colaboração com mais de 50 especialistas, especialmente em segurança de IA.
Nas semanas após seu lançamento, os usuários demonstraram aplicações notáveis do GPT-4, incluindo a criação de novas linguagens, elaboração de animações complexas e até programação de uma versão funcional do Pong em apenas sessenta segundos utilizando HTML e JavaScript.
Como usar o GPT-4
O GPT-4 está acessível a todos os usuários nos níveis de assinatura da OpenAI. Usuários da versão gratuita têm acesso limitado—aproximadamente 80 conversas em um período de três horas—após o qual são transferidos para o GPT-4o mini, menos capaz, até que o cooldown reinicie. Para aumentar o acesso ao GPT-4 e gerar imagens com DALL-E, os usuários podem optar pela assinatura ChatGPT Plus por $20 por mês. A atualização é simples: basta clicar em "Upgrade to Plus" na barra lateral do ChatGPT, inserir os dados do cartão de crédito e alternar entre GPT-4 e os modelos de linguagem anteriores.
Para quem hesita em assinar, o Bing Chat da Microsoft oferece uma maneira de experimentar as capacidades do GPT-4 gratuitamente. A Microsoft integra o GPT-4 no Bing Chat, embora alguns recursos possam estar ausentes e o serviço inclua melhorias proprietárias da Microsoft. Enquanto o Bing Chat continua gratuito, é limitado a 15 conversas por sessão e 150 sessões diárias. Diversas outras aplicações estão aproveitando o GPT-4, incluindo o Quora, uma popular plataforma de perguntas e respostas.
Quando o GPT-4 foi lançado?
O GPT-4 foi oficialmente revelado em 13 de março, após confirmação pré-lançamento da Microsoft. Inicialmente disponível para assinantes do ChatGPT Plus e através do Microsoft Copilot, o GPT-4 também é acessível como API para desenvolvedores. Empresas como Duolingo, Be My Eyes, Stripe e Khan Academy já integraram o GPT-4 em seus serviços. A primeira demonstração pública das capacidades do GPT-4 foi transmitida ao vivo no YouTube.
O que é o GPT-4o Mini?
O GPT-4o mini é a mais recente iteração da linha de modelos GPT-4 da OpenAI, otimizada para tarefas mais simples e de alto volume que priorizam a velocidade de inferência em vez das capacidades do modelo completo. Lançado em julho de 2024, o GPT-4o mini substituiu o GPT-3.5 como o modelo padrão uma vez que os usuários excedem seu limite de três horas de consultas com o GPT-4o.
O GPT-4 é melhor que o GPT-3.5?
Anteriormente, a versão gratuita do ChatGPT era baseada no GPT-3.5. No entanto, a partir de julho de 2024, o ChatGPT opera no GPT-4o mini, que demonstra desempenho superior mesmo em comparação com o GPT-3.5 Turbo. Ele compreende e responde a mais perguntas, oferece salvaguardas adicionais, fornece respostas concisas e é 60% mais econômico para operar.
A API do GPT-4
Para desenvolvedores, o GPT-4 está disponível como uma API, desde que tenham realizado pelo menos um pagamento bem-sucedido à OpenAI anteriormente. A API abrange várias versões do GPT-4 junto com modelos legados do GPT-3.5. A OpenAI anunciou que, embora o GPT-3.5 permaneça acessível, ele será eventualmente gradualmente descontinuado, embora um cronograma específico para essa transição ainda não tenha sido decidido.
A API é projetada principalmente para desenvolvedores que criam novas aplicações, mas alguns usuários têm enfrentado confusão. Por exemplo, o Plex facilita a integração do ChatGPT em seu player de música Plexamp, exigindo uma chave de API do ChatGPT separada da do ChatGPT Plus. Portanto, é necessário se inscrever para uma conta de desenvolvedor para acessar a API.
O GPT-4 está piorando?
Embora o GPT-4 tenha recebido elogios iniciais após seu lançamento, alguns usuários relataram uma queda na qualidade das respostas ao longo dos meses seguintes. Observações de figuras notáveis na comunidade de desenvolvimento surgiram, levando a discussões nos fóruns da OpenAI. Um executivo da OpenAI afirma que essas preocupações são, em grande parte, infundadas, argumentando que qualquer queda percebida é meramente subjetiva e afirmando que as versões mais novas do modelo estão em constante melhoria.
No entanto, um estudo indica que pode haver verdade nessas preocupações, uma vez que registrou uma diminuição na precisão de 97,6% em março para 2,4% em junho. Embora essa descoberta não seja conclusiva, ela apoia as afirmações de que os usuários estão experimentando mudanças reais no desempenho.
Onde está a entrada visual no GPT-4?
Um dos recursos mais esperados do GPT-4 é sua capacidade de processar entradas visuais, transformando o ChatGPT em um modelo verdadeiramente multimodal. Fazer upload de imagens para análise é tão simples quanto anexar documentos; os usuários precisam apenas clicar no ícone de clipe de papel na janela de contexto, selecionar a fonte da imagem e anexar a imagem para receber interações significativas.
Quais são as limitações do GPT-4?
Apesar das afirmações da OpenAI sobre os avanços do GPT-4, o modelo ainda enfrenta certas limitações. Assim como seus predecessores, o GPT-4 lida com questões relacionadas a preconceitos sociais, imprecisões e desafios impostos por solicitações adversariais. Consequentemente, ele não é infalível. Diversas instâncias online destacam essas deficiências, mas a OpenAI afirma que continua a trabalhar na resolução desses problemas. No geral, o GPT-4 é menos propenso a inventar informações em comparação com os modelos anteriores.
Outra limitação notável é que os dados de treinamento do GPT-4 cobrem apenas informações disponíveis até dezembro de 2023, enquanto o GPT-4o e o GPT-4o mini têm um corte em outubro de 2023. Apesar disso, as capacidades de busca na web do GPT-4 permitem localizar e recuperar informações mais recentes da internet. Com o lançamento do GPT-4o, os usuários podem esperar pelo próximo modelo GPT-5.