Recentemente, o Google fez avanços significativos em inteligência artificial ao lançar a série de modelos de IA leve e eficiente, Gemma. Este novo modelo apresenta capacidades matemáticas e de codificação excepcionais, superando o anteriormente líder, Mistral 7B, e tornando-se um forte concorrente em sua classe.
Nomeado pela palavra latina para "gema", Gemma se baseia nas forças tecnológicas e na arquitetura dos modelos Google Gemini. Está disponível em duas versões: Gemma 2B e Gemma 7B, com 2 bilhões e 7 bilhões de parâmetros, respectivamente. A versão 2B pode operar com fluidez em laptops convencionais.
Nos testes de benchmarks MMLU, o Gemma 7B alcançou uma impressionante pontuação de 64,3%, superando a pontuação de 62,5% do Mistral 7B e ultrapassando o modelo Llama-2 da Meta. Além disso, os modelos Gemma já estão disponíveis publicamente nas plataformas HuggingFace e HuggingChat, permitindo que os usuários experimentem suas poderosas capacidades generativas.
Em 18 testes de benchmark críticos, o Gemma superou modelos maiores de código aberto, incluindo o Llama-2 da Meta, em 11 testes. Demis Hassabis, CEO do Google DeepMind, elogiou o Gemma como o modelo de melhor desempenho em sua categoria de tamanho.
Este lançamento representa um marco significativo para o Google no cenário de IA, revitalizando a comunidade de código aberto. Desde o lançamento do ChatGPT, o Google tem trabalhado ativamente para alcançar o OpenAI e facilitou a fusão do Google Brain e DeepMind em março de 2023, formando o que agora é conhecido como "Aliança de Vingança do Google." Com otimizações contínuas no modelo Gemma, o Google busca assumir um papel de liderança na próxima onda de inovação em IA, impulsionando o crescimento em diversos setores.