Сегодня Stability AI представила ряд захватывающих обновлений для своей платформы Stable Diffusion, значительно расширив её возможности в области генерации изображений из текста и войдя в сферу создания 3D-контента.
Ключевым нововведением в этом обновлении является запуск модели Stable 3D. Ранее сосредоточенная на генерации двумерных (2D) изображений, теперь Stable Diffusion поддерживает широкий спектр приложений для создания 3D-контента, включая графический дизайн и разработку видеоигр.
Кроме того, Stability AI представила инструмент Sky Replacer, специально разработанный для бесшовной замены неба на 2D-изображениях. Платформа Stable Diffusion также включает в себя Stable Fine-Tuning, направленный на ускорение настройки изображений для конкретных бизнес-кейсов. Чтобы улучшить аутентификацию контента, изображения, сгенерированные через API Stability AI, теперь будут содержать невидимый водяной знак, что обеспечит большую целостность в креативных рабочих процессах по мере того, как генеративный ИИ становится всё более важным для различных отраслей.
«Мы предоставляем креативным рассказчикам инструменты для улучшенного контроля над визуализацией», — сказал Эмад Мостак, генеральный директор Stability AI, в эксклюзивном интервью.
Навигация по Конкурентной Среде Генеративного ИИ
Продвижения Stability AI происходят на фоне ожесточенной конкуренции в секторе генерации изображений из текста. Инструменты Firefly от Adobe, интегрированные с её программным обеспечением для дизайна, и недавно запущенные модели DALL-E 3 от OpenAI значительно продвигают рынок. Midjourney также наращивает свои возможности, чтобы помочь дизайнерам в генерации изображений.
Мостак осознаёт конкурентный ландшафт и стремится дифференцировать Stability AI, акцентируя внимание на создании комплексных креативных пайплайнов, а не только на предоставлении моделей. Новые функции Sky Replacer и Fine-Tuning представляют собой значительные шаги вперёд по сравнению с основной функциональностью генерации изображений.
Sky Replacer: Практический Инструмент для Бизнеса
Замена фонов изображений — не новая концепция; однако Stability AI автоматизирует этот процесс, чтобы повысить эффективность для бизнес-пользователей. Мостак подчёркивает, что инструмент Sky Replacer имеет конкретные применения, в частности, в таких отраслях, как недвижимость.
Пользователи хотят разнообразные фоны и эффекты освещения, и Stability AI сосредоточена на создании оптимизированных рабочих процессов, которые предоставляют организациям больший контроль, адаптированный к их специфическим потребностям. «Sky Replacer — это первый из множества инструментов, которые мы представим, удовлетворяющих отраслевым требованиям, основываясь на нашем опыте за последние шесть-двенадцать месяцев», — отметил он.
Stable 3D: Новые Возможности для Творцов
Новая модель Stable 3D улучшает диффузионную модель, используемую в Stable Diffusion, за счёт добавления дополнительных 3D-данных и векторизации. Мостак выразил свой энтузиазм относительно потенциала создания погружающих 3D-миров, используя основы Stable Diffusion и Objaverse-XL, одну из крупнейших 3D-баз данных в мире.
Хотя традиционные методы создания 3D-изображений могут требовать много ресурсов, Мостак считает, что Stable 3D упростит этот процесс, сделав его более эффективным. Изначально доступный в режиме предварительного просмотра, Stable 3D ожидает дальнейшего развития.
«Этот подход невероятно эффективен по сравнению с классическим созданием 3D-моделей», — отметил он. «То, что раньше занимало значительное время, теперь можно сделать быстрее».
Интеграция Водяных Знаков для Аутентичности Контента
В свете недавнего Указа администрации Байдена по ИИ, который требует внедрения водяных знаков в генерируемый контент, Stability AI реализует невидимые водяные знаки и Content Credentials в своём API. Эта инициатива, часть более широких усилий отрасли под руководством Adobe и других, направлена на обеспечение ясного авторства генерируемого контента. Мостак подчеркнул, что эти меры являются частью стремления Stability AI к содействию аутентичности в цифровом творчестве.
«Мы запускаем инициативы для определения аутентичности генерируемого контента, и интеграция нашего водяного знака является шагом к достижению этой цели», — подтвердил он. Это развитие также поддерживает будущие атрибуции и механизмы, направленные на улучшение проверки контента.