Anthropic Lança Claude 3: Superando o GPT-4 e o Gemini Ultra em Testes de Benchmark

A Anthropic, uma proeminente startup de inteligência artificial, lançou sua série de modelos de IA Claude 3, projetados para atender às diversas necessidades de clientes empresariais, com foco em inteligência, velocidade e eficiência de custos. A série inclui três modelos: Opus, Sonnet e o futuro Haiku.

No topo da lista está o Opus, que a Anthropic afirma ser superior a todos os outros sistemas de IA disponíveis publicamente, superando até mesmo os modelos líderes da OpenAI e do Google. "O Opus se destaca em uma ampla gama de tarefas, oferecendo desempenho excepcional”, declarou Dario Amodei, cofundador e CEO da Anthropic, em uma entrevista. Ele observou que o Opus supera modelos como GPT-4, GPT-3.5 e Gemini Ultra em vários benchmarks, incluindo GSM-8k para raciocínio matemático e MMLU para conhecimento especializado. "Parece consistentemente superior aos concorrentes, alcançando pontuações sem precedentes em múltiplas tarefas", compartilhou Amodei.

Embora os parâmetros completos dos principais modelos concorrentes permaneçam não divulgados, os resultados de benchmark reportados pela Anthropic sugerem que o Opus iguala ou supera alternativas como GPT-4 e Gemini em capacidades essenciais, estabelecendo um novo padrão para IA conversacional comercialmente disponível. Projetado para tarefas complexas de raciocínio, o Opus demonstra desempenho superior na linha de produtos da Anthropic.

Para empresas que buscam opções intermediárias, o Sonnet oferece uma solução econômica para análise de dados rotineira e trabalhos de conhecimento, sem comprometer o desempenho. Em contraste, o Haiku é projetado para velocidade e acessibilidade, tornando-o ideal para aplicações voltadas ao consumidor, como chatbots, onde respostas rápidas são essenciais. Amodei espera que o lançamento público do Haiku ocorra em "semanas, não meses".

Cada modelo da nova série incorpora capacidades de entrada de imagem, atendendo à crescente demanda por aplicativos como reconhecimento de texto em imagens. "Nosso foco permanece nas funcionalidades mais solicitadas pelas empresas", explicou Daniela Amodei, presidente da Anthropic, enfatizando a estratégia da empresa de priorizar funcionalidades relevantes.

Os modelos Claude 3 também exibem capacidades avançadas de visão computacional, permitindo que as empresas extraíam informações de maneira eficiente de imagens, documentos, gráficos e diagramas. "Muitos dados dos clientes são não estruturados ou visuais, tornando a extração manual trabalhosa", destacou Daniela, ressaltando aplicações potenciais nos setores jurídico, financeiro, logístico e de controle de qualidade.

O anúncio da Anthropic ocorre em meio a discussões sobre viés na IA, especialmente após controvérsias envolvendo o chatbot Gemini do Google, que enfrentou críticas por produzir imagens históricas racialmente diversas que não refletiam a realidade com precisão. O Google desativou temporariamente as funções de geração de imagem do Gemini e emitiu um pedido de desculpas, destacando os desafios contínuos que as empresas de tecnologia enfrentam ao abordar viés na IA.

Dario Amodei reconheceu o desafio de navegar pelos vieses da IA: "É uma ciência imprecisa." Ele destacou que a Anthropic possui equipes dedicadas a avaliar e mitigar riscos associados aos seus modelos. "Nossa hipótese é que o desenvolvimento de IA de ponta direcionará a tecnologia para resultados sociais positivos", afirmou Dario. No entanto, Daniela enfatizou a dificuldade de se alcançar uma IA completamente imparcial. "Criar uma ferramenta de IA generativa perfeitamente neutra é quase impossível devido às diferentes interpretações do que a neutralidade implica", observou.

A estratégia da Anthropic envolve uma abordagem conhecida como IA Constitucional, projetada para alinhar modelos a princípios definidos em uma "constituição". Apesar de sua intenção, Dario admitiu que alcançar a perfeição na mitigação de viés continua sendo um desafio. "Nos esforçamos pela neutralidade ideológica, mas ainda não a perfeicionamos", disse. "Nenhum de nós conseguiu."

Por fim, Dario afirmou que o compromisso da Anthropic com valores amplamente aceitos tem como objetivo evitar que os modelos tendam a agendas partidárias, contrastando sua abordagem com as recentes críticas ao Gemini. "Nosso objetivo é criar modelos que atendam a um público diversificado sem promover qualquer ponto de vista político específico", concluiu.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles