Esqueça o GPT-5! A OpenAI apresenta a nova família de modelos de IA o1, com desempenho em nível de doutorado.

Desde o lançamento do poderoso modelo de linguagem GPT-4 da OpenAI em março de 2023, usuários e desenvolvedores aguardam ansiosamente a chegada de seu sucessor, o GPT-5. No entanto, a OpenAI está trilhando um caminho diferente ao apresentar uma nova família de modelos: a série o1.

Introdução à Família de Modelos o1

A OpenAI revelou seus mais recentes modelos de IA, o o1-preview e o o1-mini, desenvolvidos especificamente para lidar com tarefas complexas e resolver problemas desafiadores de forma mais eficaz em comparação com a série GPT. Disponível hoje para usuários do ChatGPT Plus, o modelo o1-preview é limitado a 30 mensagens por semana, enquanto o o1-mini permite até 50 mensagens. É importante ressaltar que, como modelos iniciais, suas funcionalidades ainda estão em desenvolvimento e atualmente não possuem recursos como navegação na web e upload de arquivos, disponíveis no GPT-4.

Capacidades Superiores dos Modelos o1

A OpenAI afirma que a série o1 se destaca na resolução de problemas intrincados em diversas áreas, como ciência, saúde e tecnologia. Esses modelos foram projetados para ajudar físicos na formulação de equações complexas e pesquisadores de saúde na anotação eficaz de dados de sequenciamento celular. O modelo o1-mini oferece recursos robustos para desenvolvedores, tornando-o adequado para executar fluxos de trabalho em várias etapas, depurar código e enfrentar desafios de programação.

o1-preview: Desempenho em Nível de Doutorado

O modelo o1-preview dedica mais tempo para respostas elaboradas, imitando a abordagem humana na resolução de problemas. Testes mostraram que ele pode operar em um nível comparável a estudantes de doutorado nas áreas de física, química e biologia. Em programação, ele se classificou no 89º percentil em competições do Codeforces, demonstrando alta proficiência em depuração e geração de soluções. No exame de qualificação da Olimpíada Internacional de Matemática, resolveu 83% dos problemas, superando significativamente a taxa de sucesso de 13% do GPT-4. Este modelo está atualmente acessível para usuários do ChatGPT Plus e do Team, com usuários do Enterprise e Edu ganhando acesso na próxima semana. Além disso, desenvolvedores elegíveis para o nível 5 da API podem utilizar os modelos o1, embora limites iniciais de taxa se apliquem.

o1-mini: Acessível e Eficiente

Junto ao o1-preview, a OpenAI lançou o modelo o1-mini, uma versão simplificada que oferece raciocínio mais rápido e econômico. Embora se especialize em programação e áreas STEM, o o1-mini apresentou resultados impressionantes, alcançando 70% no benchmark de matemática da IMO, muito próximo dos 74% do o1-preview, mas a um custo significativamente menor. Em avaliações de programação, alcançou um escore Elo de 1650 no Codeforces, posicionando-se entre os 86% melhores programadores. Com um preço 80% reduzido em comparação ao o1-preview, o o1-mini atende desenvolvedores e pesquisadores que buscam habilidades de raciocínio sem o vasto conhecimento do modelo mais avançado. Ele estará disponível para usuários do ChatGPT Plus, Team, Enterprise e Edu, com planos para incluir usuários do ChatGPT Free no futuro.

Melhorias em Segurança e Proteção

A dedicação da OpenAI à segurança é evidente em ambos os modelos, que contam com mecanismos de treinamento de segurança aprimorados. O modelo o1-preview obteve uma impressionante pontuação de 84 em um dos testes de jailbreak mais desafiadores, uma melhora substancial em relação à pontuação de 22 do GPT-4. A capacidade desses modelos de raciocinar sobre protocolos de segurança em contexto os torna mais aptos a lidar com solicitações inseguras e a mitigar o risco de geração de conteúdo inadequado. A OpenAI também estabeleceu parcerias com os Institutos de Segurança em IA dos EUA e do Reino Unido, facilitando a avaliação e teste de futuros sistemas de IA.

Desenvolvimentos Futuros para a Série o1

Enquanto o o1-preview e o o1-mini são ferramentas poderosas de resolução de problemas, a OpenAI reconhece que isso é apenas o começo. A empresa planeja melhorar esses modelos regularmente, adicionando recursos como navegação na web, upload de arquivos e chamadas de função em futuras atualizações. À medida que a OpenAI continua a desenvolver tanto a série GPT quanto a o1, os usuários podem esperar avanços contínuos que aprimoram as capacidades e a acessibilidade da IA em diversas aplicações.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles