人気のAI画像生成サービス、Midjourneyが、多くのユーザーから要望されていた新機能を発表しました。それは、異なる画像間でキャラクターを一貫して再現する能力です。この機能は、AI画像ジェネレーターにとって大きな課題でした。特に、拡散モデルに依存しているため、Stability AIのStable Diffusionのようなツールは、何百万もの人間が作成した画像からデータを取り込み、ユーザーが提供したテキストを元に画像をピクセル単位で作成します。
一貫したキャラクターの重要性
OpenAIのChatGPTのような大規模言語モデル(LLM)と同様に、生成AIアプリケーションは一貫性の維持が難しいケースがあります。同じキーワードを使っても、各プロンプトはユニークな出力を生み出します。この特性は新しいコンテンツを生成するには有益ですが、映画や小説、グラフィックノベル、漫画のストーリーボードなど、キャラクターの認識と連続性が重要な場面を複雑にしています。
このニーズに応えるため、Midjourneyは「–cref」タグ(キャラクターリファレンスの略)を導入しました。このタグをMidjourneyのDiscordでのテキストプロンプトに追加することで、ユーザーは以前に生成した画像からキャラクターを参照できます。AIは、提供されたURLに基づいてキャラクターの顔の特徴、体型、服装を一致させることを目指します。
Midjourneyの一貫したキャラクター機能の使い方
「–cref」タグは、すでにMidjourneyで生成された画像と組み合わせて使用するのが最適です。以下の手順で進めてみましょう。
1. 既存のキャラクターのURLを生成するか見つけます。
2. 例として、「ひげを生やし、目隠しをした筋肉質のハゲ男」というプロンプトを使ってキャラクターを作成します。
3. お気に入りの画像を選択したら、MidjourneyのDiscordでその画像をコントロールクリックしてリンクをコピーします。
4. 次に、「白いタキシードを着て別荘に立っている –cref [URL]」といった新しいプロンプトを作成し、コピーしたURLを貼り付けます。Midjourneyは、新しい設定で同じキャラクターを生成しようとします。
結果が元のキャラクターやプロンプトと完全に一致するわけではありませんが、成果は期待が持てます。また、「–cw」タグを使用して新しい画像がどれだけ元の画像に似ているかを調整することができます。1から100の数値を後に続け、値が高いほど元のキャラクターに近い画像が生成されます。
例えば、低い「cw」設定8を使用すると、希望する白いタキシードが得られますが、目隠しなどの特徴的な要素は失われる可能性があります。このような詳細は微調整によって修正可能です。
複数キャラクターの生成
ユーザーは、2つの「–cref」タグとそれぞれのURLを使用することで、複数のキャラクターを含む画像を生成できます。この機能は最近導入されたばかりで、アーティストたちはその可能性を探求しています。
公式な注意事項
Midjourneyの創設者デイビッド・ホルツは、この機能について以下の情報を共有しました:
- 使用方法: プロンプトの後に「–cref URL」を追加します。URLはキャラクター画像へのリンクです。
- 強度の調整: 「–cw」を使用してリファレンスの強度を調整します。デフォルトは100です。0に設定すると顔の特徴のみに焦点を当てます。
- キャラクターの焦点: この機能はMidjourneyが作成したキャラクター向けに設計されており、実在の人物には適していません。細部の再現には限界があります(例:えくぼやロゴなど)。
- モデルの互換性: 「cref」機能はNijiと通常のMidjourneyモデル両方に対応しています。
Midjourneyのこの革新的な機能を活用し、より一貫した物語やビジュアルストーリーを創り出してみましょう!