Stable Diffusion 3.5: Улучшенный отклик на запросы и повышенное разнообразие в создании персонажей

Stable Diffusion — это открытая альтернатива генераторам изображений с искусственным интеллектом, таким как Midjourney и DALL-E. Она выпустила версию 3.5, которая отвечает на критику предыдущей версии Stable Diffusion 3 Medium, столкнувшейся с широкой неодобрением. Stability AI утверждает, что модель 3.5 обеспечивает лучшее соответствие запросам и соперничает с более крупными моделями по качеству изображений. Кроме того, она предназначена для создания разнообразных стилей, оттенков кожи и черт лица без явных подсказок.

Новая модель доступна в трёх версиях:

1. Stable Diffusion 3.5 Large: Это самая мощная версия, обеспечивающая наивысшее качество и лидерство в соответствии с запросами. Stability AI утверждает, что она подходит для профессионального использования с разрешением 1 МП.

2. Stable Diffusion 3.5 Large Turbo: Упрощённая версия Large, которая акцентирует внимание на эффективности, генерируя высококачественные изображения с отличным соответствием запросам всего за четыре шага.

3. Stable Diffusion 3.5 Medium: Эта модель предназначена для потребительского оборудования и сочетает качество и доступность, позволяя генерировать изображения с разрешением от 0,25 до 2 мегапикселей. Однако эта версия станет доступной только 29 октября, в отличие от первых двух моделей, которые уже доступны.

Выпуск версии 3.5 следует за проблемным запуском Stable Diffusion 3 Medium в июне, когда модель генерировала абсурдно гротескные изображения в ответ на простые запросы. Stability AI признала, что предыдущая версия "не полностью соответствовала нашим стандартам или ожиданиям сообщества", подчеркивая акцент на соответствии запросам в текущем релизе.

Кроме того, серия 3.5 включает новые фильтры, стремящиеся лучше отражать человеческое разнообразие, демонстрируя различные оттенки кожи и черты лица без обширных подсказок. Это улучшение стало ответом на предыдущие ошибки в представлении, такие как спор Google в начале этого года, когда её модель Gemini генерировала исторически неточные изображения. Реакция на этот инцидент привела к тому, что Google задержала интеграцию генераций людей на шесть месяцев.

С этими улучшениями мы надеемся, что Stable Diffusion 3.5 сможет эффективно захватывать нюансы человеческого разнообразия и исторические контексты в своих результатах.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles