В Google AI Studio скоро появятся две захватывающие новые функции, ответившие на важные запросы разработчиков. Эта платформа для прототипирования и экспериментов с моделями машинного обучения теперь включает в себя извлечение кадров из видео и кэширование контекста. Функция извлечения кадров из видео доступна уже сегодня, а кэширование контекста вскоре будет добавлено в API Gemini.
С помощью извлечения кадров из видео разработчики могут использовать загруженные в свои приложения видео, позволяя Gemini захватывать отдельные кадры или последовательности изображений. Эта функциональность повышает способность ИИ интерпретировать сцены, генерировать краткие резюме и улучшать пользовательские впечатления. Вы можете найти возможность извлечения кадров из видео в API Gemini.
Кэширование контекста позволяет разработчикам, работающим с большими массивами информации, хранить часто запрашиваемый контекст, что снижает затраты и оптимизирует рабочие процессы. Вместо того чтобы повторно отправлять файлы в Gemini, разработчики могут отправить их один раз. Google подчеркивает полезность кэширования контекста для различных сценариев, таких как генерация идей для контента, анализ сложных документов и резюмирование научных статей и учебных материалов. Эта функция будет поддерживаться в API Gemini после своего запуска.
Эти обновления являются частью серии захватывающих анонсов о Gemini на конференции разработчиков Google, наряду с запуском Gemini 1.5 Flash, новой модели Gemma 2 и предобученного варианта под названием PaliGemma.