Hoje, o Google DeepMind anunciou o lançamento do Gemma, seus novos modelos de IA de código aberto disponíveis com 2B e 7B de parâmetros. Esses modelos utilizam a mesma pesquisa e tecnologia que impulsionaram os modelos recentemente apresentados, Gemini.
O Gemma estará disponível em variantes pré-treinadas e ajustadas por instrução, acompanhadas de uma licença comercial permissiva e uma ferramenta de IA Generativa Responsável. Além disso, o Google DeepMind fornecerá ferramentas para inferência e ajuste fino supervisionado (SFT), compatíveis com os principais frameworks: JAX, PyTorch e TensorFlow via Keras 3.0. Os desenvolvedores poderão acessar notebooks prontos para uso no Colab e Kaggle, e o Gemma é compatível com Hugging Face, MaxText e NVIDIA NeMo. Os modelos pré-treinados e ajustados por instrução podem ser executados em laptops, estações de trabalho ou Google Cloud, com opções de implantação no Vertex AI e Google Kubernetes Engine.
A NVIDIA também colaborou com o Google para aprimorar as otimizações em todas as plataformas de IA da NVIDIA, incluindo PCs RTX AI locais, para aumentar o desempenho do Gemma.
Jeanine Banks, Vice-Presidente e Gerente Geral da Developer X do Google, destacou que os modelos Gemma representam a continuidade do compromisso do Google com a tecnologia de código aberto para o desenvolvimento de IA, fundamentando-se em ferramentas como TensorFlow e JAX, além de modelos como PaLM2 e AlphaFold. Ela enfatizou os insights obtidos durante o desenvolvimento dos modelos Gemini, revelando que os desenvolvedores costumam utilizar tanto modelos abertos quanto APIs em diferentes etapas de seus fluxos de trabalho. “Nosso objetivo é ser o único fornecedor de APIs e modelos abertos, oferecendo a mais ampla gama de capacidades para nossa comunidade,” afirmou Banks.
Tris Warkentin, Diretor de Gestão de Produtos do Google DeepMind, anunciou que a empresa lançará benchmarks abrangentes que avaliarão o Gemma em comparação com outros modelos, os quais estarão acessíveis nas classificações do OpenLLM. “Estamos fazendo parceria com a NVIDIA e Hugging Face para garantir que todos os benchmarks públicos sejam realizados com esses modelos,” disse, expressando orgulho pela abordagem transparente e focada na comunidade durante o desenvolvimento.
O Gemma é descrito como "responsável por design". Warkentin enfatizou que esses modelos passaram por avaliações rigorosas para garantir a segurança. A postagem do blog do Google DeepMind detalhou que o Gemma está alinhado com os Princípios de IA, incorporando técnicas automatizadas para filtrar informações pessoais de conjuntos de dados de treinamento e utilizando aprendizado por reforço com feedback humano (RLHF) para promover comportamentos responsáveis. Avaliações rigorosas, incluindo testes manuais e automatizados, foram realizadas para avaliar os perfis de risco dos modelos.
Warkentin também ressaltou a importância de um ecossistema aberto na promoção de uma IA responsável. “Acreditamos que as perspectivas diversas de desenvolvedores e pesquisadores globalmente são essenciais para um feedback eficaz e sistemas de segurança aprimorados,” afirmou. “Integrar esse feedback e a comunicação com a comunidade é fundamental para o valor deste projeto.”