Anthropic Lança Claude 3: Superando o GPT-4 e o Gemini Ultra em Testes de Benchmark

Home Notícias de IA Anthropic Lança Claude 3: Superando o GPT-4 e o Gemini Ultra em Testes de Benchmark

A Anthropic, uma proeminente startup de inteligência artificial, lançou sua série de modelos de IA Claude 3, projetados para atender às diversas necessidades de clientes empresariais, com foco em inteligência, velocidade e eficiência de custos. A série inclui três modelos: Opus, Sonnet e o futuro Haiku.

No topo da lista está o Opus, que a Anthropic afirma ser superior a todos os outros sistemas de IA disponíveis publicamente, superando até mesmo os modelos líderes da OpenAI e do Google. "O Opus se destaca em uma ampla gama de tarefas, oferecendo desempenho excepcional”, declarou Dario Amodei, cofundador e CEO da Anthropic, em uma entrevista. Ele observou que o Opus supera modelos como GPT-4, GPT-3.5 e Gemini Ultra em vários benchmarks, incluindo GSM-8k para raciocínio matemático e MMLU para conhecimento especializado. "Parece consistentemente superior aos concorrentes, alcançando pontuações sem precedentes em múltiplas tarefas", compartilhou Amodei.

Embora os parâmetros completos dos principais modelos concorrentes permaneçam não divulgados, os resultados de benchmark reportados pela Anthropic sugerem que o Opus iguala ou supera alternativas como GPT-4 e Gemini em capacidades essenciais, estabelecendo um novo padrão para IA conversacional comercialmente disponível. Projetado para tarefas complexas de raciocínio, o Opus demonstra desempenho superior na linha de produtos da Anthropic.

Para empresas que buscam opções intermediárias, o Sonnet oferece uma solução econômica para análise de dados rotineira e trabalhos de conhecimento, sem comprometer o desempenho. Em contraste, o Haiku é projetado para velocidade e acessibilidade, tornando-o ideal para aplicações voltadas ao consumidor, como chatbots, onde respostas rápidas são essenciais. Amodei espera que o lançamento público do Haiku ocorra em "semanas, não meses".

Cada modelo da nova série incorpora capacidades de entrada de imagem, atendendo à crescente demanda por aplicativos como reconhecimento de texto em imagens. "Nosso foco permanece nas funcionalidades mais solicitadas pelas empresas", explicou Daniela Amodei, presidente da Anthropic, enfatizando a estratégia da empresa de priorizar funcionalidades relevantes.

Os modelos Claude 3 também exibem capacidades avançadas de visão computacional, permitindo que as empresas extraíam informações de maneira eficiente de imagens, documentos, gráficos e diagramas. "Muitos dados dos clientes são não estruturados ou visuais, tornando a extração manual trabalhosa", destacou Daniela, ressaltando aplicações potenciais nos setores jurídico, financeiro, logístico e de controle de qualidade.

O anúncio da Anthropic ocorre em meio a discussões sobre viés na IA, especialmente após controvérsias envolvendo o chatbot Gemini do Google, que enfrentou críticas por produzir imagens históricas racialmente diversas que não refletiam a realidade com precisão. O Google desativou temporariamente as funções de geração de imagem do Gemini e emitiu um pedido de desculpas, destacando os desafios contínuos que as empresas de tecnologia enfrentam ao abordar viés na IA.

Dario Amodei reconheceu o desafio de navegar pelos vieses da IA: "É uma ciência imprecisa." Ele destacou que a Anthropic possui equipes dedicadas a avaliar e mitigar riscos associados aos seus modelos. "Nossa hipótese é que o desenvolvimento de IA de ponta direcionará a tecnologia para resultados sociais positivos", afirmou Dario. No entanto, Daniela enfatizou a dificuldade de se alcançar uma IA completamente imparcial. "Criar uma ferramenta de IA generativa perfeitamente neutra é quase impossível devido às diferentes interpretações do que a neutralidade implica", observou.

A estratégia da Anthropic envolve uma abordagem conhecida como IA Constitucional, projetada para alinhar modelos a princípios definidos em uma "constituição". Apesar de sua intenção, Dario admitiu que alcançar a perfeição na mitigação de viés continua sendo um desafio. "Nos esforçamos pela neutralidade ideológica, mas ainda não a perfeicionamos", disse. "Nenhum de nós conseguiu."

Por fim, Dario afirmou que o compromisso da Anthropic com valores amplamente aceitos tem como objetivo evitar que os modelos tendam a agendas partidárias, contrastando sua abordagem com as recentes críticas ao Gemini. "Nosso objetivo é criar modelos que atendam a um público diversificado sem promover qualquer ponto de vista político específico", concluiu.

A Amazon Integra Claude 3, Superando o GPT-4, na Plataforma Bedrock

Cinco Maneiras como a IA Melhora a Segurança Contra Ataques à Cadeia de Suprimentos que Almejam Equipes de DevOps

Most people like

WindyBot

165.4K

O WindyBot oferece ferramentas de IA de ponta, projetadas para aumentar a produtividade e estimular a criatividade. Nossas funcionalidades incluem assistência avançada na escrita, geração de arte, análises abrangentes e soluções de chatbot interativas. Desperte seu potencial com a tecnologia inovadora do WindyBot.

Escritor de IA AI Chatbot

MagicForm

41.1K

MagicForm é um aplicativo inovador que transforma facilmente textos em perguntas de quiz por meio de tecnologia avançada de IA. Perfeito para educadores e alunos, ele torna o processo de criação de quizzes envolventes muito mais ágil.

Questionários AI Quizzes

Level AI

24.8K

Descubra insights valiosos, melhore o desempenho e otimize operações com a automação.

inteligência de contact center AI Customer Service Assistant

Towards AI Jobs

27.4K

Descubra a plataforma de busca de emprego definitiva, projetada exclusivamente para profissionais de aprendizado de máquina. Conecte-se com as principais empresas e explore oportunidades de trabalho personalizadas no campo em constante evolução do aprendizado de máquina. Comece hoje mesmo sua jornada em direção ao emprego dos seus sonhos!

aprendizado de máquina AI Recruiting

Find AI tools in YBX