Google запускает серию Gemma 2: представление модели с 27B параметрами, которая может работать всего на одном TPU.

В феврале прошлого года Google DeepMind представил Gemma, выпустив два открытых модели с 2 миллиардами и 7 миллиардами параметров. На конференции разработчиков Google I/O 2023 компания анонсировала серию Gemma 2, начиная с легковесной модели с внушительными 27 миллиардами параметров, которую планируют выпустить в июне.

«Эта модель на 27 миллиардов параметров была выбрана специально», — заявил Джош Удвард, вице-президент Google Labs, на недавнем круглом столе. «Она оптимизирована для графических процессоров следующего поколения от Nvidia или единого TPU в Vertex AI, что делает её удобной для пользователей. Мы уже наблюдаем отличное качество — производительность превышает показатели моделей вдвое больше её размера».

Gemma предназначена для разработчиков, стремящихся интегрировать ИИ в приложения и устройства без значительных требований к памяти и вычислительной мощности. Это делает её идеальной для ограниченных ресурсов, таких как смартфоны, устройства IoT и персональные компьютеры. С момента запуска Google представил несколько вариаций, включая CodeGemma для автозавершения кода, RecurrentGemma для улучшения памяти и недавно выпущенную PaliGemma для задач обработки изображений и языка.

С 27 миллиардами параметров Gemma 2 готова предложить повышенную точность и производительность для более сложных задач по сравнению с предшественниками. Доступ к большему объему обучающего датасета позволяет ИИ генерировать качественные ответы быстрее.

Хотя Удвард отметил, что Gemma 2 предназначена для работы на одном TPU, он конкретно упомянул TPUv5e, чип последнего поколения Google, выпущенный в августе прошлого года. Это означает, что Gemma 2 потребует единого специализированного чипа ИИ для оптимизации вычислений, что приведет к снижению задержек и повышению эффективности для задач, таких как распознавание изображений и обработка естественного языка. Эта эффективность преобразуется в экономию средств для разработчиков, позволяя им реинвестировать ресурсы в свои приложения.

Дебют Gemma 2 совпадает с запуском OpenAI GPT-4o, многомодальной языковой модели, и позиционируется как «существенное обновление», особенно для бесплатных пользователей ChatGPT.

Most people like

Find AI tools in YBX