Gemini возобновляет запуск изображений людей, созданных с помощью ИИ, с улучшенным обновлением Imagen 3.

Google представляет усовершенствованные инструменты генеративного ИИ: Imagen 3 и Gems

Google обновляет свои инструменты генеративного ИИ, начиная с запуска Imagen 3 — нового поколения генератора изображений. Это обновление восстанавливает ранее удаленную возможность генерировать AI-изображения людей, преодолевая прежние споры вокруг этой функции. Кроме того, новый чат-бот Gemini теперь включает в себя «Gems» — функцию, позволяющую пользователям создавать кастомизированные боты с персонализированными инструкциями, аналогичную настраиваемым GPT от ChatGPT.

Imagen 3: Улучшенная генерация изображений

Imagen 3 установлен на новый стандарт качества изображений с встроенными защитными механизмами, предотвращающими проблемы с разнообразием, которые беспокоили предыдущие версии. По словам менеджера по продуктам Gemini Дэйва Ситрона, «по широкому кругу параметров Imagen 3 показывает отличные результаты по сравнению с другими моделями генерации изображений». Обновленный инструмент позволяет пользователям направлять процесс создания изображений с помощью дополнительных подсказок, если первый результат не соответствует ожиданиям.

Новая модель также включает в себя технологию Google SynthID для водяных знаков на изображениях, четко указывая на их искусственное происхождение и избегая путаницы с настоящими фотографиями. Ситрон сообщил, что возможность генерировать изображения людей вскоре станет доступной для платных пользователей при соблюдении мер безопасности, предотвращающих создание «фотореалистичных узнаваемых лиц», а также изображений с детьми или графическим, насильственным или сексуальным содержанием. Признавая, что изображения Gemini могут быть не идеальными, он заверил пользователей, что компания будет продолжать совершенствовать модель на основе отзывов.

Введение Gems: Кастомизированные чат-боты для повышения функциональности

Gems, впервые представленные на мероприятии Google I/O 2024, позволяют пользователям создавать кастомизированные чат-боты, ориентированные на конкретные задачи. Эта функция предлагает решение для пользователей, нуждающихся в помощи с проектами, мозговыми штурмами или созданием подписей для социальных сетей. Ситрон подчеркнул: «Ваш Gem может запомнить детальный набор инструкций, чтобы помочь вам сэкономить время на утомительных, повторяющихся или сложных задачах».

Чтобы повысить вовлеченность пользователей, Gemini также предложит предустановленные Gems, созданные для вдохновения и оптимизации рабочих процессов. Некоторые из доступных предустановленных Gems включают:

- Обучающий коуч: Помогает в понимании сложных тем.

- Идеи для проектов: Генерирует новые идеи для проектов.

- Коуч по карьере: Содействует в улучшении навыков и принятии карьерных решений.

- Редактор текстов: Предоставляет конструктивную обратную связь по грамматике и структуре.

- Партнер по программированию: Помогает разработчикам улучшать навыки кода и вдохновляет на новые проекты.

Gems начинают свое развертывание сегодня для настольных и мобильных устройств, но в настоящее время доступны только подписчикам Gemini Advanced, Business и Enterprise. Для использования этих инновационных функций пользователям потребуется выбрать платный план.

Усовершенствуя свои возможности ИИ, Google стремится предоставить более интуитивные и эффективные инструменты, отвечая на растущий спрос на сложные генеративные технологии.

Most people like

Find AI tools in YBX