Чуть более месяца спустя после выпуска своей продвинутой модели текст-к-изображению, Ideogram анонсировала обновление с несколькими новыми функциями, включая ссылку на описание и негативный промпт. Эти улучшения, доступные на веб-платформе Ideogram, предназначены для предоставления пользователям большего контроля над созданием изображений, а также для повышения качества и согласованности результатов. Это обновление является значительным шагом в конкуренции с устоявшимися соперниками в области генерации изображений, такими как Midjourney и DALL-E.
Что нового в Ideogram?
С момента запуска версии 1.0 в феврале пользователи получили доступ к функции «магического промпта», обогащающей их ввод. На этой основе Ideogram представила новую возможность под названием Describe, генерирующую подписи на основе референсных изображений. Пользователи могут загружать публичные изображения, сгенерированные Ideogram, или свои собственные, что позволяет ИИ создать текстовое описание. Это описание можно доработать для создания аналогичного изображения, адаптированного к конкретным требованиям.
Кроме того, Ideogram внедряет негативный промпт, который позволяет пользователям указывать, что они не хотят видеть в результатах. Эта функция помогает исключать определённые объекты или стили из финальной генерации. Также пользователи могут выбирать среди режимов Fast, Default и Quality для генерации выходных данных. Режим Fast создает базовые изображения примерно за пять секунд, режим Quality фокусируется на фотореализме и занимает около двадцати секунд. Режим Default обеспечит баланс и создаст изображения примерно за двенадцать секунд. Хотя уровень использования этих режимов ещё не определён, Ideogram призывает их применять для быстрой генерации базового изображения, а затем дорабатывать его для получения более качественных результатов.
Улучшенный фотореализм и рендеринг текста
Ideogram также улучшает возможности рендеринга текста, уменьшая уровень ошибок на 15%. Хотя это изменение может показаться незначительным, компания утверждает, что оно превосходит DALL-3 Vivid в генерации символов и слов. Хотя статистика сравнения обновлённой модели с Midjourney не опубликована, Ideogram подтверждает, что последняя версия предлагает улучшенную согласованность изображений и фотореализм, получая от человеческих оценщиков на 30-50% больше отметок за соответствие промпту, согласованность изображения и качество рендеринга текста. С момента запуска публичной бета-версии в прошлом году Ideogram привлекла более семи миллионов создателей.
На данный момент негативный промпт и режимы скорости доступны только пользователям тарифных планов Basic и Plus. Доступность функции генерации подписей к референсным изображениям пока неясна, хотя возможно, что она будет бесплатной, как функция Remix. Улучшения в согласованности текста и изображения доступны всем пользователям.