В феврале прошлого года Google DeepMind представил Gemma, выпустив два открытых модели с 2 миллиардами и 7 миллиардами параметров. На конференции разработчиков Google I/O 2023 компания анонсировала серию Gemma 2, начиная с легковесной модели с внушительными 27 миллиардами параметров, которую планируют выпустить в июне.
«Эта модель на 27 миллиардов параметров была выбрана специально», — заявил Джош Удвард, вице-президент Google Labs, на недавнем круглом столе. «Она оптимизирована для графических процессоров следующего поколения от Nvidia или единого TPU в Vertex AI, что делает её удобной для пользователей. Мы уже наблюдаем отличное качество — производительность превышает показатели моделей вдвое больше её размера».
Gemma предназначена для разработчиков, стремящихся интегрировать ИИ в приложения и устройства без значительных требований к памяти и вычислительной мощности. Это делает её идеальной для ограниченных ресурсов, таких как смартфоны, устройства IoT и персональные компьютеры. С момента запуска Google представил несколько вариаций, включая CodeGemma для автозавершения кода, RecurrentGemma для улучшения памяти и недавно выпущенную PaliGemma для задач обработки изображений и языка.
С 27 миллиардами параметров Gemma 2 готова предложить повышенную точность и производительность для более сложных задач по сравнению с предшественниками. Доступ к большему объему обучающего датасета позволяет ИИ генерировать качественные ответы быстрее.
Хотя Удвард отметил, что Gemma 2 предназначена для работы на одном TPU, он конкретно упомянул TPUv5e, чип последнего поколения Google, выпущенный в августе прошлого года. Это означает, что Gemma 2 потребует единого специализированного чипа ИИ для оптимизации вычислений, что приведет к снижению задержек и повышению эффективности для задач, таких как распознавание изображений и обработка естественного языка. Эта эффективность преобразуется в экономию средств для разработчиков, позволяя им реинвестировать ресурсы в свои приложения.
Дебют Gemma 2 совпадает с запуском OpenAI GPT-4o, многомодальной языковой модели, и позиционируется как «существенное обновление», особенно для бесплатных пользователей ChatGPT.