Na segunda-feira, a Anthropic anunciou o lançamento do Claude 3, uma nova série composta por três modelos de linguagem de IA projetados para avançar a tecnologia de inteligência artificial. A empresa afirma que esses modelos estabelecem novos padrões na indústria para diversas tarefas cognitivas e demonstram capacidades que se aproximam das humanas. Os usuários podem acessar esses modelos através do site oficial da Anthropic, com a versão mais avançada disponível apenas por assinatura.
A série Claude 3 conta com três modelos de diferentes níveis de complexidade e parâmetros: Claude 3 Haiku, Claude 3 Sonnet e Claude 3 Opus. O modelo Sonnet está atualmente disponível gratuitamente, enquanto o acesso ao Opus requer uma assinatura mensal de US$ 20 no plano "Claude Pro". Todos os três modelos possuem uma janela de contexto de 200.000 tokens.
Em comparação com iterações anteriores, o Claude 3 apresenta melhorias notáveis em tarefas como raciocínio, especialização, matemática e fluência linguística. A empresa relata que o Opus demonstra compreensão em nível humano em tarefas complexas. Os novos modelos também possuem capacidades aprimoradas de processamento visual, permitindo gerenciar diversos formatos, incluindo fotos e gráficos, similares ao GPT-4V e ao Gemini do Google.
Em termos de desempenho e custo-benefício, a série Claude 3 foi ainda mais otimizada. O Opus cobra US$ 15 por milhão de tokens de entrada, enquanto o Sonnet e o Haiku têm preços significativamente mais baixos, a US$ 3 e US$ 0,25, respectivamente, tornando-se mais acessíveis do que o GPT-4 Turbo e o GPT-3.5 Turbo da OpenAI.
A Anthropic se compromete a atualizar frequentemente a série Claude 3 nos próximos meses, com planos de introduzir novos recursos, como integrações de ferramentas e programação interativa. Importante ressaltar que melhorias nas medidas de segurança foram implementadas, reduzindo os riscos potenciais ao mínimo.
Testes iniciais indicam que o Opus apresenta capacidades semelhantes ao ChatGPT-4, especialmente em resumo de informações e análise lógica. No entanto, gerar conteúdo humorístico original continua sendo um desafio. A padronização de benchmarking pode não capturar completamente o desempenho do modelo, uma vez que as necessidades e contextos específicos dos usuários podem influenciar significativamente a eficácia dos assistentes de IA.
No final, os usuários devem realizar testes pessoais ao selecionar um modelo que melhor atenda às suas necessidades, já que diferentes ambientes e tarefas podem levar a resultados amplamente variados. Em geral, embora o Claude 3 da Anthropic mostre promessas, uma avaliação cuidadosa é essencial.