流行的人工智能图像生成服务Midjourney推出了用户期待已久的一项新功能:在不同图像中保持角色的一致性。这一能力一直是AI图像生成器面临的重大挑战,主要由于它们依赖扩散模型。这些工具,如Stability AI的Stable Diffusion,通过处理用户提供的文本来逐像素生成图像,利用的是由数百万张人类创作的图像组成的庞大训练数据集。
在生成AI中一致性角色的重要性
与OpenAI的ChatGPT等文本基础的大型语言模型(LLM)类似,生成AI应用在保持一致性方面常常遇到困难。每次提示都会产生独特的输出,即使使用相同的关键词。虽然这一特性对生成新内容很有帮助,但在电影、小说、漫画和图画小说的故事板创作中,故事连续性和角色识别至关重要。
为满足这一需求,Midjourney推出了“–cref”标签(代表“角色参考”)。用户在Midjourney Discord中添加此标签到文本提示后,可以引用之前生成图像中的角色。AI将根据提供的URL尽量匹配角色的面部特征、身体类型和服装。
如何使用Midjourney的一致性角色功能
“–cref”标签最好与已经在Midjourney中生成的图像配合使用。以下是操作步骤:
1. 生成或找到现有角色的URL。
2. 例如,创建一个角色的提示:“一个有胡须且戴眼罩的壮汉”。
3. 选择您喜欢的图像,按住控制键并单击图像以复制链接。
4. 然后,可以创建新提示,例如:“穿着白色燕尾服站在别墅中 –cref [URL]”,将复制的URL粘贴进去。Midjourney会尝试在新场景中生成相同的角色。
虽然结果可能与原来的角色或提示不完全一致,但效果令人满意。用户还可以通过使用“–cw”标签并输入1到100之间的数字,调整新图像与原始图像的相似度。较高的“cw”值表示与原始角色更接近,而较低的数字则允许更多的变化。
例如,使用设置为8的低“cw”值可能会生成您想要的白色燕尾服,但可能会失去如眼罩这样的独特特征,您可以通过一些调整来修正。
组合多个角色
用户还可以通过使用两个“–cref”标签和各自的URL,创建包含多个角色的图像。该功能最近推出,艺术家们正在探索其潜力。
官方说明
Midjourney创始人David Holz分享了关于此功能的最新消息:
- 使用说明:在提示后添加标签“–cref URL”,其中URL链接到角色图像。
- 强度调整:使用“–cw”修改参考强度,默认值为100。设置为0将仅关注面部特征。
- 角色聚焦:该功能用于Midjourney生成的角色,而非真实个人,精确度有限——无法准确复制如酒窝或标志等小细节。
- 模型兼容性:该“cref”功能适用于Niji和常规Midjourney模型。
探索Midjourney这一创新功能,开始打造更连贯的叙事和视觉故事吧!