인기 있는 AI 이미지 생성 서비스인 Midjourney가 사용자들이 가장 요청했던 기능 중 하나인 캐릭터를 다양한 이미지에서 일관되게 재현하는 기능을 도입했습니다. 이 기능은 확산 모델에 의존하는 AI 이미지 생성기에게 큰 도전 과제가 되어왔습니다. Stable Diffusion과 같은 도구들은 사용자 제공 텍스트를 처리하여 픽셀 단위로 이미지를 생성하며, 수백만 개의 인간이 만든 이미지로 구성된 방대한 훈련 데이터를 사용합니다.
생성 AI에서 일관된 캐릭터의 중요성
OpenAI의 ChatGPT와 같은 텍스트 기반의 대규모 언어 모델(LLM)처럼, 생성 AI 애플리케이션은 일관성 유지에 어려움을 겪습니다. 동일한 키워드를 반복 사용하더라도 각 프롬프트는 고유한 출력을 생성합니다. 새로운 콘텐츠를 생성하는 데 유용하지만, 영화, 소설, 그래픽 노블, 만화의 스토리보드 작업 등 관성 및 캐릭터 인식이 중요한 상황에서는 복잡성을 증가시킵니다.
이러한 필요를 해결하기 위해 Midjourney는 “–cref” 태그(캐릭터 참조의 약자)를 출시했습니다. 사용자는 Midjourney Discord에서 텍스트 프롬프트에 이 태그를 추가함으로써 이전에 생성된 이미지의 캐릭터를 참조할 수 있습니다. AI는 제공된 URL을 기반으로 캐릭터의 얼굴 특징, 체형 및 의상을 일치시키려 합니다.
Midjourney의 일관된 캐릭터 기능 사용법
“–cref” 태그는 이미 Midjourney에서 생성된 이미지에 가장 효과적입니다. 다음은 단계별 작업 흐름입니다:
1. 기존 캐릭터의 URL을 생성하거나 찾습니다.
2. 예를 들어, “수염과 안대가 있는 근육질 대머리 남자”라는 프롬프트로 캐릭터를 생성해봅니다.
3. 마음에 드는 이미지를 선택한 후, Midjourney Discord에서 해당 이미지를 Control 클릭하여 링크를 복사합니다.
4. 이후 새로운 프롬프트를 작성합니다: “흰색 턱시도를 입고 별장에 서 있는 –cref [URL]”와 같이 복사한 URL을 붙여넣습니다. Midjourney는 새로운 설정에서 동일한 캐릭터를 생성하려 합니다.
결과가 원래 캐릭터나 프롬프트와 정확히 일치하지는 않지만, 기대 이상의 결과를 얻을 수 있습니다. 사용자는 “–cw” 태그 뒤에 1에서 100 사이의 숫자를 사용하여 새로운 이미지가 원본과 얼마나 비슷한지 조정할 수 있습니다. 높은 “cw” 값은 원본 캐릭터와의 더욱 근접한 일치를 의미하고, 낮은 숫자는 더 많은 변화를 허용합니다. 예를 들어, 낮은 “cw” 설정 8을 사용하면 원하는 흰색 턱시도를 얻을 수 있지만, 안대와 같은 독특한 특징이 사라질 수 있으며, 이는 약간의 수정으로 개선할 수 있습니다.
캐릭터 조합하기
사용자는 각기 다른 URL과 함께 두 개의 “–cref” 태그를 사용하여 여러 캐릭터가 포함된 이미지를 생성할 수 있습니다. 이 기능은 최근에 출시되었으며, 이미 아티스트들이 그 가능성을 탐구하고 있습니다.
공식 노트
Midjourney의 창립자인 David Holz는 이 기능에 대한 업데이트를 공유했습니다:
- 사용 지침: 프롬프트 뒤에 “–cref URL” 태그를 추가하여 URL이 캐릭터 이미지로 링크되도록 합니다.
- 강도 조정: “–cw”를 사용하여 참조 강도를 조정할 수 있으며, 기본값은 100입니다. 0으로 설정하면 오직 얼굴 특징에만 집중합니다.
- 캐릭터 집중: 이 기능은 Midjourney에서 생성된 캐릭터를 위한 것으로, 실제 인물에 대한 정확성은 제한적이며 사소한 세부 사항(예: 보조개나 로고)을 정확히 복제하지는 않습니다.
- 모델 호환성: “cref” 기능은 Niji와 일반 Midjourney 모델 모두에서 작동합니다.
Midjourney의 혁신적인 기능을 탐험하고 더욱 일관된 내러티브와 시각적 이야기를 만들어보세요!