A OpenAI surpreendeu a comunidade tecnológica ontem ao revelar uma nova família de modelos de linguagem de raciocínio (LLMs) chamada "o1", em vez do esperado "Strawberry" ou GPT-5. Os modelos o1 foram projetados para se destacar em tarefas nas áreas de ciência, tecnologia, engenharia e matemática (STEM), oferecendo alto desempenho e precisão.
Agora, estão disponíveis dois novos modelos: o o1-preview e o o1-mini, que possui menos parâmetros. Ambos estão acessíveis para usuários do ChatGPT Plus e desenvolvedores que utilizam a API paga da OpenAI, permitindo que integrem os modelos em aplicações existentes ou criem novas.
Capacidades Avançadas de Raciocínio
De acordo com Michelle Pokrass, líder técnica da API da OpenAI, os modelos o1 utilizam técnicas avançadas de raciocínio, adaptando estratégias, aprendendo com erros e passando por processos cognitivos rigorosos. Em testes, esses modelos se mostraram comparáveis a estudantes de doutorado em benchmarks desafiadores.
Nikunj Handa, da OpenAI, destacou que os modelos o1 superam significativamente a série GPT em tarefas relacionadas a raciocínio.
Detalhes Importantes para Desenvolvedores
- Saídas Apenas de Texto: Atualmente, ambos os modelos são limitados a entradas e saídas de texto, o que os torna menos adequados para tarefas que exigem capacidades multimodais, como análise de imagens ou arquivos. Para essas necessidades, o GPT-4o continua sendo a escolha recomendada.
- Limite de Conhecimento: Os modelos o1 não conseguem navegar na web, dependendo exclusivamente de seus dados de treinamento até outubro de 2023, embora os usuários possam fornecer contexto adicional via entrada de texto.
- Tempo de Resposta: A geração de saídas é mais lenta, com algumas respostas levando mais de um minuto, mas testadores iniciais relataram aumento de desempenho em tarefas como programação e elaboração de documentos legais.
A OpenAI recomenda que, enquanto o GPT-4o é ideal para tarefas que exigem respostas rápidas, os modelos o1 podem ser mais adequados para aplicações que necessitam de raciocínio aprofundado.
Estrutura de Preços
O acesso aos modelos o1 requer um investimento significativo nas APIs da OpenAI, disponíveis apenas para usuários do "Tier 5" que gastaram pelo menos $1.000 e fizeram pagamentos há mais de 30 dias. O modelo o1-preview é notavelmente caro, custando $15 por milhão de tokens de entrada e $60 por milhão de tokens de saída. O o1-mini tem um preço mais acessível, a $3 por milhão de tokens de entrada e $12 por milhão de tokens de saída.
Atualmente, os modelos o1 estão limitados a 20 solicitações por minuto, e o agrupamento de solicitações não é suportado.
Aplicações para os Modelos o1
Desde o lançamento do o1-preview e do o1-mini, os desenvolvedores começaram a explorar suas aplicações. Algumas descobertas iniciais incluem:
- Geração de Documentos: Os modelos podem produzir planos de ação bem elaborados e white papers com base em solicitações simples.
- Otimização Operacional: Usuários demonstraram a capacidade do o1-preview de automatizar agendamentos de pessoal, avaliar riscos de fusão, projetar armazéns eficientes e equilibrar redes elétricas.
- Desenvolvimento de Aplicativos e Jogos: O modelo o1-preview facilita a criação rápida de aplicações interativas e jogos.
- Automação de RFP: Os modelos o1 podem ajudar contratantes a completar documentos de solicitações de propostas, processando a entrada textual dos RFPs.
- Planejamento Estratégico: Desenvolvedores notaram a eficácia do o1-preview na geração de estratégias de crescimento detalhadas, incluindo o uso de plataformas como Reddit para engajamento.
Acesso aos Modelos o1 da OpenAI
Os desenvolvedores podem acessar os modelos o1 através da API pública da OpenAI, do Microsoft Azure OpenAI Service, do Azure AI Studio e dos Modelos do GitHub. Embora não sejam adequados para todos os desenvolvedores, a introdução da família o1 apresenta oportunidades únicas para aqueles que buscam inovar em aplicações de IA. A OpenAI está comprometida em aprimorar tanto a família o1 quanto sua série GPT existente, oferecendo opções diversificadas para desenvolvedores.