Stable Diffusion 3.5：提升提示响应和角色生成多样性

Home AI News CN Stable Diffusion 3.5：提升提示响应和角色生成多样性

Stable Diffusion，作为Midjourney和DALL-E等AI图像生成器的开源替代品，推出了3.5版本。此次更新回应了对之前3.0版本的批评，后者遭到了广泛的不满。Stability AI声称，3.5模型在提示遵从性上有所改进，并在图像质量上能与更大模型竞争。此外，该模型能够在没有明确提示的情况下生成多样的风格、肤色和特征。

新版本分为三个不同的型号：

1. Stable Diffusion 3.5大模型Large：这是最强大的版本，具有最高的图像质量，并在提示遵从性方面处于行业领先地位。Stability AI表示，适合以1兆像素的分辨率进行专业使用。

2. Stable Diffusion 3.5大模型Turbo：这一精简版的大模型优先考虑效率，且能在仅四个步骤中生成高质量的图像，保持优异的提示遵从性。

3. Stable Diffusion 3.5中型Medium：该模型为消费者硬件设计，平衡了质量与可接入性，支持生成0.25至2兆像素的图像。然而，3.5中型将在10月29日后发布，而前两个模型目前已可使用。

此次3.5版本的发布，旨在纠正6月发布的3.0中型模型的问题，当时该模型在简单提示下产生了荒诞不堪的图像。Stability AI承认，之前的版本“未能完全满足我们的标准和社区的期望”，这也使得当前版本更加重视提示遵从性。

此外，3.5系列加入了新的过滤器，更好地展现人类多样性，能够在不进行大量提示的情况下展示各种肤色和特征。这样的提升旨在避免过去的代表性失误，例如，谷歌早前因Gemini模型生成历史不准确图像而引发的争议，导致其推迟了六个月的人类生成整合。

随着这些改进，我们期待Stable Diffusion 3.5能够有效捕捉人类多样性和历史背景的细节，提升用户的使用体验。

OpenAI与微软共同资助1000万美元，支持人工智能驱动的新闻项目

Anthropic 赋能 Claude AI，助您掌控电脑操作

Most people like

Asseter.AI

44.1K

CG Artists的强大创作利器：提升效率与创意的完美结合

CG资产 AI 图像识别

Infinity AI

43.6K

以人为中心的生成式视频模型是一种新兴的技术，旨在根据用户的需求和偏好生成个性化的视频内容。这类模型利用深度学习和人工智能算法，将用户的输入转化为丰富的视觉故事。这不仅提升了视频创作的效率，还有助于增强观众的体验。通过优化视觉元素和叙事结构，这些模型能够制作出与用户期待相符的高质量视频，真正实现以人性化为核心的创作理念。

AI视频模型提示

InVideo

10.1M

InVideo是一个功能强大的在线视频编辑器，提供丰富的高质量模板、图库和音乐，帮助用户轻松制作专业级视频内容。

在线视频编辑器 AI 视频编辑器

GPT Engineer

29.6K

利用对话式AI工具，轻松构建和部署网络应用程序。

人工智能软件工程师 AI网站设计师

Find AI tools in YBX