Stable Diffusion 3.5:加強提示回應與角色生成的多樣性提升

Stable Diffusion作為開源的AI圖像生成器替代品,最近推出了3.5版本。此更新針對先前Stable Diffusion3 Medium的批評意見進行了改進,該版本曾受到廣泛的不滿。Stability AI聲稱,3.5版在提示遵循性方面有所提升,並能在圖像質量上與大型模型媲美。此外,該模型設計旨在無需明確提示即可產生多樣的風格、膚色和特徵。

新模型分為三個版本:

1. Stable Diffusion3.5 Large:這是最強大的版本,提供最高的質量,並在提示遵循性方面領先業界。Stability AI表示,這一版本適用於專業用途,支援1 MP解析度。

2. Stable Diffusion3.5 Large Turbo:這是一個精簡版的Large模型,優先考慮效率,在僅四個步驟內生成高質量圖像並保持優異的提示遵循性。

3. Stable Diffusion3.5 Medium:專為消費者硬體設計的此模型,兼顧質量和可及性,支援生成0.25至2兆像素的圖像。該版本將於10月29日上線,而前兩個模型目前已可使用。

3.5版發布之前,Stable Diffusion3 Medium在6月的推出中出現問題,該模型對簡單提示生成了荒謬的怪異圖像。Stability AI承認,先前版本“未能完全達到我們的標準或社群的期望”,並在此次更新中更加強調了提示遵循性。

此外,3.5系列還引入了新過濾器,旨在更好地展現人類多樣性,無需繁瑣的提示即可展示各種膚色和特徵。這一增強措施是針對早前錯誤代表性的修正,例如谷歌今年早些時候的爭議,其Gemini模型生成了歷史上不準確的圖像。該事件引發的反響導致谷歌將人類生成整合延遲六個月。

隨著這些改進,我們期待Stable Diffusion3.5能夠在其輸出中有效捕捉人類多樣性和歷史背景的微妙之處。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles