Pesquisadores Descobrem que Google Gemini Fica Atrás do GPT-3.5 Turbo

Home Notícias de IA Pesquisadores Descobrem que Google Gemini Fica Atrás do GPT-3.5 Turbo

Updated on dezembro 19 2023

Oh, Google. Você algum dia lançará um produto de IA com sucesso na primeira tentativa?

Menos de um mês após lançar o Gemini, seu tão aguardado concorrente do ChatGPT, o Google enfrentou críticas significativas devido a interações ensaiadas confirmadas em sua demonstração promocional. Pesquisas recentes mostram que a versão mais avançada disponível ao consumidor, Gemini Pro, fica atrás do modelo de linguagem GPT-3.5 Turbo da OpenAI na maioria das tarefas.

Os resultados, apresentados por uma equipe da Carnegie Mellon University e BerriAI em seu artigo “Uma Análise Profunda das Habilidade Linguísticas do Gemini”, revelam que o Gemini Pro apresenta um desempenho ligeiramente inferior ao GPT-3.5 Turbo em várias atividades. O estudo, publicado em arXiv.org, destaca que, em 19 de dezembro de 2023, a precisão do Gemini Pro era notavelmente menos impressionante do que a do modelo mais antigo da OpenAI.

Um porta-voz do Google respondeu, afirmando que pesquisas internas demonstram que o Gemini Pro supera o GPT-3.5 e que uma versão mais poderosa, o Gemini Ultra, será lançada no início de 2024, com desempenho superior ao do GPT-4 em testes internos. Eles afirmaram: “O Gemini Pro supera modelos otimizados para inferência, como o GPT-3.5, e desempenha de forma comparável a outros modelos líderes.”

Os pesquisadores testaram quatro modelos de linguagem: Google Gemini Pro, OpenAI GPT-3.5 Turbo, GPT-4 Turbo e Mistral Mixtral 8x7B. Eles utilizaram o site agregador de IA, LiteLLM, para avaliar os modelos ao longo de quatro dias, empregando várias solicitações, incluindo 57 perguntas de múltipla escolha nas áreas de STEM, humanidades e ciências sociais.

No teste de perguntas e respostas baseado em conhecimento, o Gemini Pro obteve 64,12/60,63, enquanto o GPT-3.5 Turbo alcançou 67,75/70,07 e o GPT-4 Turbo registrou 80,48/78,95. Notavelmente, o Gemini favoreceu consistentemente a opção de resposta “D”, indicando um viés potencialmente devido à falta de ajuste para formatos de múltipla escolha. Além disso, teve dificuldades em categorias específicas, como sexualidade humana e lógica formal, devido a restrições de respostas de segurança.

O Gemini Pro superou o GPT-3.5 Turbo em questões de microeconomia de ensino médio e segurança; no entanto, esses ganhos foram mínimos. Ao testar consultas mais longas ou complexas, o Gemini Pro mostrou menor precisão em comparação com ambos os modelos GPT, embora tenha se destacado em tarefas de classificação de palavras e manipulação de símbolos.

Em capacidades de programação, o Gemini novamente apresentou deficiências, apresentando desempenho inferior ao do GPT-3.5 Turbo ao completar tarefas de código em Python. Embora o Gemini Pro tenha mostrado potencial em tradução de idiomas - superando o GPT-3.5 Turbo e o GPT-4 Turbo em várias línguas - também exibiu uma tendência de bloquear respostas em muitos pares de idiomas devido à moderação de conteúdo.

As implicações desses achados são significativas para as ambições de IA do Google. À medida que a chegada do Gemini Ultra se aproxima, o Google pode continuar a ficar atrás da OpenAI em desempenho de IA generativa. Curiosamente, a pesquisa também indicou que a Mixtral 8x7B da Mistral teve desempenho inferior ao do GPT-3.5 Turbo em várias tarefas, sugerindo que, embora o Gemini Pro não seja o melhor, ainda supera alguns concorrentes emergentes.

No geral, o estudo reforça a ideia de que a OpenAI atualmente mantém sua liderança na paisagem de IA generativa. Como observou especialistas como o professor Ethan Mollick, da Universidade da Pensilvânia, para a maioria das aplicações individuais, o GPT-4 continua sendo a escolha superior - pelo menos até que o Gemini Ultra seja lançado no próximo ano.

É possível um Chevy por $1? Explorando Chatbots de IA e Seus Riscos no Atendimento ao Cliente da Indústria Automotiva

Patronus AI Identifica Vulnerabilidades de Segurança 'Preocupantes' em Principais Sistemas de IA

Most people like

Mojju

18.3K

Descubra GPTs personalizados únicos adaptados para diversas aplicações. Se você deseja aumentar a produtividade, despertar criatividade ou otimizar a comunicação, nossos modelos especializados são projetados para atender às suas necessidades específicas. Explore hoje as infinitas possibilidades das soluções de IA personalizadas!

Ferramentas de IA AI Knowledge Base

Writer

1.6M

Apresentamos o Writer: uma plataforma avançada de IA projetada para moldar soluções de IA generativa que promovem o crescimento rápido dos negócios. Experimente o poder da IA personalizada para aumentar a produtividade e a inovação em sua organização.

IA generativa empresarial Other

Items.Design

11.6K

Desbloqueie um tesouro de ativos de design gerados por IA, perfeitos para aprimorar seus sites, aplicativos e apresentações. Explore uma coleção diversificada que eleva seus projetos com visuais impressionantes e designs intuitivos, tudo sem custo!

IA AI Art Generator

ReplyAI

10.3K

Transforme Sua Experiência com E-mails: Escreva E-mails 10x Mais Rápido com o GPT-V No mundo digital acelerado de hoje, redigir e-mails de forma eficiente é fundamental. Com o GPT-V, você pode aumentar sua produtividade e agilizar seu processo de comunicação, permitindo que escreva e-mails até 10 vezes mais rápido. Descubra como essa poderosa ferramenta pode revolucionar a maneira como você se conecta com colegas, clientes e amigos, permitindo que você se concentre no que realmente importa.

GPT AI Reply Assistant

Find AI tools in YBX