Google объявил, что легкие модели серии Gemma 2 будут доступны исследователям и разработчикам через Vertex AI, начиная с следующего месяца. Изначально содержащая модель с 27 миллиардами параметров, серия теперь включает вариант с 9 миллиардами параметров, что удивило многих в технологическом сообществе.
Gemma 2 была представлена на Google I/O в мае, заменив предыдущие модели с 2 и 7 миллиардами параметров, запущенные ранее в этом году. Эта модель нового поколения оптимизирована для работы с последними графическими процессорами Nvidia и однопроцессорными TPU в Vertex AI. Она нацелена на поддержку разработчиков, стремящихся интегрировать ИИ в приложения и устройства, такие как смартфоны, IoT-устройства и персональные компьютеры.
Новые модели Gemma 2 отражают достижения в области технологий ИИ, позволяя создавать более компактные и эффективные модели, соответствующие различным потребностям пользователей. С введением как опций на 9, так и на 27 миллиардов параметров Google предлагает разработчикам гибкость для приложений, работающих на устройствах или в облаке. Открытый исходный код Gemma 2 также облегчает настройку и интеграцию в различные проекты.
Будет интересно посмотреть, как существующие вариации Gemma—CodeGemma, RecurrentGemma и PaliGemma—используют эти новые модели для повышения функциональности.
Кроме того, Google планирует в ближайшее время представить модель с 2.6 миллиарда параметров, направленную на «сокращение разрыва между легкостью доступа и мощной производительностью».
Gemma 2 в настоящее время доступна через Google AI Studio, с возможностью загрузки весов модели с Kaggle и Hugging Face. Исследователи могут бесплатно получить доступ к Gemma 2 через Kaggle или воспользоваться бесплатным уровнем, предоставляемым для Colab-ноутбуков.