Google представил Gemini 1.5, последнюю версию своей системы разговорного ИИ, характеризующуюся значительными улучшениями в эффективности, производительности и способности к долгосрочному рассуждению. В блоге Дэмиса Хасабиса, руководителя Google AI, были акцентированы ключевые архитектурные улучшения, позволяющие Gemini 1.5 Pro достичь производительности крупнейшей модели компании, Gemini 1.0 Ultra, при этом потребляя меньше вычислительных ресурсов. Gemini 1.0 Ultra была представлена всего на прошлой неделе.
Одним из самых значительных достижений является внедрение контекстного окна на миллион токенов, что представляет собой прорыв в понимании длинных контекстов. Стандартная модель Gemini может анализировать запросы в контексте до 128,000 токенов. С обновлением до миллиона токенов, Gemini 1.5 может обрабатывать гораздо больший объем непрерывной информации перед генерацией ответа.
Данная возможность миллиона токенов позволяет проводить долгосрочные рассуждения. Генеральный директор Google Сундар Пичай продемонстрировал способности Gemini 1.5, показав, как система может суммировать полный текст миссии Apollo 11 или анализировать 44-х минутный немой фильм с Бастером Китоном.
Хасабис объяснил, что расширенный контекст позволяет Gemini 1.5 бесшовно анализировать, классифицировать и резюмировать объемный контент. Первоначальные результаты указывают на то, что производительность остается высокой даже с расширенным контекстом.
На данный момент вопрос о публичной доступности версии с миллионом токенов остается неясным. Google предлагает ограниченный превью-режим для избранных разработчиков и корпоративных пользователей через свою платформу Vertex AI.
Этот релиз следует за недавним ребрендингом разговорного ИИ Google с Bard на Gemini и запуском платного уровня Gemini Advanced, использующего модель Ultra 1.0. Gemini позиционируется как конкурент ChatGPT Plus от OpenAI.
Хасабис отметил, что улучшения в эффективности Gemini 1.5 позволят команде Google быстрее разрабатывать, обучать и предоставлять более продвинутые версии Gemini, чем когда-либо. Пичай подчеркнул приверженность Google ответственному развитию Gemini, следуя принципам ИИ. Компания провела обширное этическое и безопасностное тестирование Gemini 1.5, сосредоточившись на безопасности контента и его представлении.
Темпы прогресса в области разговорного ИИ значительно ускорились с момента запуска ChatGPT в прошлом году. Эксперты объясняют это снижением затрат на обучение и инновациями, такими как архитектура Sparsely-Gated Mixture-of-Experts от Google, которая способствует быстрому развитию новых версий.
С Gemini 1.5 Google стремится укрепить свои лидерские позиции в секторе ИИ. Вопрос заключается в том, когда эти прорывные возможности долгосрочного рассуждения будут интегрированы в потребительские продукты Google.