Google активно улучшает свою серию Gemini по мере подготовки к выходу версии 2.0. Сегодня компания представила две новые версии: Gemini 1.5 Flash-8B, меньший аналог Gemini 1.5, и обновленные версии Gemini 1.5 Flash и Gemini 1.5 Pro. По словам Google, эти модели демонстрируют заметные улучшения по различным внутренним тестам, с значительным повышением производительности для 1.5 Flash и расширенными возможностями в математике, программировании и сложных запросах для 1.5 Pro.
"Gemini 1.5 Flash в настоящее время является лучшим вариантом для разработчиков по всему миру," заявил Логан Килпатрик, руководитель продукта Google AI Studio, в публикации на X.
Последние экспериментальные итерации моделей Gemini
Выпущенная в мае, Gemini 1.5 Flash способна обрабатывать длинные контексты и анализировать детальную информацию более чем из 10 миллионов токенов. Это позволяет ей справляться с высокообъемными мультимодальными входными данными, включая документы, видео и аудио.
Новая версия Gemini 1.5 Flash с 8 миллиардами параметров предлагает улучшенный опыт работы, в то время как обновленная Gemini 1.5 Pro повышает производительность в программировании и сложных задачах, служа простым заменителем своей предыдущей версии, выпущенной в августе. Килпатрик отметил, что готовая версия ожидается в ближайшие несколько недель, и она, вероятно, будет включать функции оценки. Он подчеркнул, что эти экспериментальные модели являются важными для сбора отзывов разработчиков и ускорения обновлений.
Последние итерации Gemini 1.5 Flash и Pro имеют лимит в 1 миллион токенов и доступны для бесплатного тестирования через Google AI Studio и API Gemini. Также планируется их включение в экспериментальный интерфейс Vertex AI. Одно из направлений будет бесплатным, а ожидается, что в будущем появится полноценная версия.
С 3 сентября Google автоматически перенаправит запросы на новую модель, постепенно отключая старую версию из Google AI Studio и API, чтобы снизить путаницу. "Мы ждем ваших отзывов и надеемся увидеть, как эта модель может открыть новые возможности для мультимодального использования," поделился Килпатрик на X.
Беспрецедентный масштаб Gemini 1.5
Исследователи Google DeepMind описывают масштаб Gemini 1.5 как "беспрецедентный" среди современных языковых моделей. Килпатрик выразил благодарность за энтузиазм сообщества по отношению к первоначальной экспериментальной модели, выпущенной в начале месяца, подчеркивая усилия, вложенные в реализацию этих инноваций.
Смешанная реакция на недавние обновления
Ранние отзывы сообщества оказались разнообразными — от восторженных похвал до скептицизма. В недавнем обновлении рейтинга Организации Соединенных Моделей (LMSO) Gemini 1.5 Flash поднялась с 23-й на 6-ю позицию на основании 20,000 голосов сообщества, что демонстрирует ее конкурентоспособность с моделями, такими как Llama, превосходя некоторые более ранние разработки Google.
Хотя некоторые пользователи отметили "значительные улучшения", особенно в анализе изображений, также появились критические замечания. Некоторые задавались вопросом о частоте обновлений, предлагая более значительную версию, такую как Gemini 2.0. Другие описали новый релиз как страдающий от "ленивой болезни кодирования", подобно проблемам с GPT-4 Turbo, утверждая, что она испытывает трудности с длинными выводами и согласованностью.
В комментариях также звучали вопросы о креативности названий моделей, что вызывало улыбки у пользователей. Дискуссии о моделях Gemini продолжают развиваться, отражая сложности прогресса в области ИИ и expectativas пользователей.