Google Lança a Série Gemma 2: Apresentando um Modelo de 27 Bilhões de Parâmetros que Funciona com Apenas um TPU

Quando o Google DeepMind apresentou o Gemma em fevereiro passado, lançou dois modelos de código aberto com 2 bilhões e 7 bilhões de parâmetros. Na conferência Google I/O deste ano, a empresa revelou a série Gemma 2, começando com um modelo leve que impressiona com 27 bilhões de parâmetros. No entanto, seu lançamento está agendado para junho.

"Esse modelo de 27B foi escolhido intencionalmente", afirmou Josh Woodward, Vice-Presidente do Google Labs, durante uma recente mesa-redonda. "Ele é otimizado para as GPUs de próxima geração da Nvidia ou para um único host TPU no Vertex AI, tornando-o fácil de usar. Já estamos vendo uma qualidade excelente, com performance superior a modelos duas vezes maiores."

O Gemma é projetado para desenvolvedores que desejam integrar IA em aplicativos e dispositivos sem exigir grande memória ou potência de processamento. Isso o torna ideal para ambientes com recursos limitados, como smartphones, dispositivos IoT e computadores pessoais. Desde seu lançamento inicial, o Google introduziu várias variantes, incluindo o CodeGemma para conclusão de código, RecurrentGemma para eficiência de memória aprimorada e o recém-lançado PaliGemma para tarefas de visão e linguagem.

Com 27 bilhões de parâmetros, o Gemma 2 está pronto para oferecer maior precisão e desempenho em tarefas mais complexas em comparação com seus antecessores. O acesso a um conjunto de dados de treinamento maior permite que a IA gere respostas de alta qualidade mais rapidamente.

Embora Woodward tenha afirmado que o Gemma 2 foi projetado para rodar em um único TPU, ele se referiu especificamente ao TPUv5e, o chip de última geração do Google lançado em agosto passado. Isso significa que o Gemma 2 exigirá um chip de IA especializado para otimizar os cálculos, resultando em menor latência e maior eficiência em tarefas como reconhecimento de imagem e processamento de linguagem natural. Essa eficiência se traduz em economia de custos para os desenvolvedores, permitindo que reinvistam recursos em suas aplicações.

A estreia do Gemma 2 coincide com o lançamento do GPT-4o da OpenAI, seu LLM multimodal, e é posicionado como uma “atualização significativa”, especialmente para usuários gratuitos do ChatGPT.

Most people like

Find AI tools in YBX