流行的人工智慧圖像生成服務 Midjourney 引入了最受用戶期待的功能之一:能夠在不同圖像中一致地重現角色。這一能力為人工智慧圖像生成器帶來了重大挑戰,主要因為它們依賴於擴散模型。這些工具,如 Stability AI 的 Stable Diffusion,通過處理用戶提供的文本,以逐像素的方式生成圖像,並使用來自數百萬人類創建的圖像的龐大訓練數據集。
一致性角色在生成式 AI 中的重要性
與類似 OpenAI 的 ChatGPT 的大型語言模型(LLMs)相似,生成式 AI 應用程序通常難以保持一致性。每個提示都會產生一個獨特的輸出,即使重複使用相同的關鍵字。雖然這一特性有助於生成新內容,但在製作電影、小說、漫畫等需要連貫性和角色識別的情境中卻十分複雜。
為了滿足這一需求,Midjourney 推出了 “–cref” 標籤(代表“角色參考”)。用戶在 Midjourney Discord 中將此標籤添加到文本提示中,即可引用先前生成圖像中的角色。AI 將根據提供的 URL 嘗試匹配角色的面部特徵、身體類型和服裝。
如何使用 Midjourney 的一致性角色功能
“–cref” 標籤最適用於已在 Midjourney 中生成的圖像。以下是操作步驟:
1. 生成或找到現有角色的 URL。
2. 例如,創建一個角色的提示為:“一位身材健壯的秃頭男士,留著鬍鬚並戴著眼罩。”
3. 選擇您喜愛的圖像後,在 Midjourney Discord 中控制點擊以複製連結。
4. 接著可以創建新的提示,例如:“穿著白色燕尾服站在別墅中 –cref [URL]”,並粘貼複製的 URL。Midjourney 將嘗試在您的新場景中生成相同角色。
雖然產出的結果可能未必完全符合原始角色或提示,但效果顯著。用戶還可以通過使用 “–cw” 標籤(後接介於 1 到 100 之間的數字)來調整新圖像與原始角色的相似程度。較高的“cw”值意味著與原始角色匹配得更緊密,而較低的數字則允許更多變化。例如,設定低 “cw” 值為 8,可能會生成理想的白色燕尾服,但可能會失去如眼罩等獨特特徵,這種細節可通過調整來修正。
結合角色
用戶可以通過在圖像中使用兩個 “–cref” 標籤及其各自的 URL 來創建包含多個角色的圖像。這一功能剛剛推出,藝術家們已經開始探索其潛力。
官方說明
Midjourney 創始人 David Holz 分享了此功能的更新:
- 使用說明:在提示後添加標籤 “–cref URL”,其中 URL 指向角色圖像。
- 強度調整:使用 “–cw” 來修改參考強度,100 為默認值。設置為 0 專注於面部特徵。
- 角色焦點:此功能專為 Midjourney 創建的角色設計,非真實個體,精確度有限,無法準確重現如酒窩或標誌等小細節。
- 模型兼容性:該 “cref” 功能適用於 Niji 和普通 Midjourney 模型。
探索 Midjourney 的這一創新功能,開始創造更連貫的敘事和視覺故事吧!