Google запустил Gemini 1.5 Flash — компактную мультимодальную модель, предназначенную для масштабируемости и высокочастотных задач. С контекстным окном на один миллион токенов она теперь доступна для публичного предварительного просмотра через API Gemini в Google AI Studio.
Кроме того, Gemini 1.5 Pro, представленный в феврале, получит значительное обновление с расширением контекстного окна до двух миллионов токенов (с одного миллиона). Разработчикам, заинтересованным в этом обновлении, необходимо записаться в список ожидания.
Что нового в Gemini 1.5?
Gemini 1.5 Flash и Gemini 1.5 Pro ориентированы на разные потребности. Gemini 1.5 Flash акцентирует внимание на скорости вывода и идеально подходит для быстроты выполнения задач с низкой латентностью. В то время как Gemini 1.5 Pro оптимизирован для более сложных, многоступенчатых задач и демонстрирует производительность, сопоставимую с крупной моделью Google 1.0 Ultra. По словам Джоша Вудварда, вице-президента Google Labs, разработчикам следует выбирать Gemini 1.5 Flash для задач, требующих быстрого отклика, в то время как Gemini 1.5 Pro лучше подходит для комплексных приложений.
Такой уровень организации позволяет разработчикам выбирать из множества моделей ИИ, отходя от универсального подхода. Предоставляя различные возможности, Google улучшает пользовательский опыт в ИИ-сервисах. Однако для некоторых разработчиков может оказаться ограничением то, что Gemini 1.5 Flash не обучен на достаточно больших наборах данных. В таких случаях обновление до Gemini 1.5 Pro может оказаться выгодным.
Линейка моделей Gemini включает в себя варианты от легких Gemma и Gemma 2 до Gemini Nano, Gemini 1.5 Flash, Gemini 1.5 Pro и Gemini 1.0 Ultra. Как отмечает Вудвард, "разработчики могут переходить между этими моделями в зависимости от требований к использованию", при этом сохраняя мультимодальные входные возможности и единый опыт работы с бекендом.
Это объявление появилось вскоре после того, как OpenAI представила своего конкурента, GPT-4o — мультимодальную крупную языковую модель (LLM), ориентированную на широкий доступ пользователей, включая настольное приложение.
Обе модели Gemini 1.5 теперь доступны для публичного предварительного просмотра более чем в 200 странах и территориях, включая Европейскую экономическую зону, Великобританию и Швейцарию.