Midjourney Lance une Nouvelle Fonctionnalité pour Créer des Personnages Cohérents dans Plusieurs Images Générées par IA

Le service populaire de génération d'images par IA, Midjourney, a lancé l'une de ses fonctionnalités les plus demandées : la possibilité de recréer de manière cohérente des personnages à travers différentes images.

Cette capacité représente un défi majeur pour les générateurs d'images par IA, en raison de leur dépendance aux modèles de diffusion. Ces outils, comme Stable Diffusion de Stability AI, fonctionnent en traitant le texte fourni par l'utilisateur pour créer des images pixel par pixel, en utilisant des données provenant d'un vaste ensemble d'images créées par des humains.

Pourquoi la cohérence des personnages est-elle essentielle dans l'IA générative ?

Tout comme les modèles de langage de grande taille (LLMs) tels que ChatGPT d'OpenAI, les applications d'IA générative rencontrent souvent des difficultés de cohérence. Chaque prompt produit une sortie unique, même si les mêmes mots-clés sont réutilisés. Bien que cette caractéristique soit avantageuse pour générer du contenu nouveau, elle complique des situations telles que le storyboard pour des films, des romans, des bandes dessinées, où la continuité et la reconnaissance des personnages sont cruciales.

Pour répondre à ce besoin, Midjourney a lancé le tag “–cref” (abréviation de “character reference”). En ajoutant ce tag à leurs prompts dans le Discord de Midjourney, les utilisateurs peuvent faire référence à un personnage d'une image générée précédemment. L'IA va alors s'efforcer de correspondre aux traits du visage, à la silhouette et aux vêtements du personnage en fonction de l'URL fournie.

Comment utiliser la fonctionnalité de personnage cohérent de Midjourney

Le tag “–cref” fonctionne mieux avec des images déjà générées dans Midjourney. Voici un processus étape par étape :

1. Générez ou trouvez l'URL d'un personnage existant.

2. Par exemple, créons un personnage avec le prompt : “un homme musclé, chauve avec une barbe et un cache-œil.”

3. Une fois que vous avez sélectionné votre image préférée, faites un clic control dessus dans le Discord de Midjourney pour copier le lien.

4. Vous pouvez ensuite créer un nouveau prompt tel que “portant un smoking blanc debout dans une villa –cref [URL]”, en collant l'URL copiée. Midjourney tentera de générer le même personnage dans votre nouveau cadre.

Bien que le résultat puisse ne pas correspondre exactement au personnage ou au prompt original, les résultats sont prometteurs. Les utilisateurs peuvent également ajuster la similarité de la nouvelle image avec l'original en utilisant le tag “–cw” suivi d'un nombre entre 1 et 100. Une valeur “cw” plus élevée signifie une correspondance plus proche avec le personnage original, tandis qu'un nombre plus bas permet plus de variation.

Par exemple, en utilisant un réglage “cw” bas de 8, vous pourriez obtenir le smoking blanc souhaité, mais au détriment de certaines caractéristiques distinctives comme le cache-œil – un détail pouvant être corrigé avec quelques ajustements.

Combiner des personnages

Les utilisateurs peuvent créer des images mettant en scène plusieurs personnages en utilisant deux tags “–cref” avec leurs URL respectives. Cette fonctionnalité a été lancée récemment, et les artistes commencent déjà à en explorer le potentiel.

Notes officielles

David Holz, le fondateur de Midjourney, a partagé une mise à jour sur cette fonctionnalité :

- Instructions d'utilisation : Ajoutez le tag “–cref URL” après votre prompt, où l'URL renvoie à une image de personnage.

- Ajustements de puissance : Utilisez “–cw” pour modifier la force de référence, avec 100 comme valeur par défaut. Le réglage à 0 se concentre uniquement sur les traits du visage.

- Concentration sur le personnage : Cette fonctionnalité est conçue pour les personnages créés par Midjourney, et non pour des personnes réelles, la précision étant limitée – elle ne répliquera pas les détails mineurs comme les fossettes ou les logos avec exactitude.

- Compatibilité des modèles : La fonctionnalité “cref” fonctionne avec les modèles Niji et les modèles réguliers de Midjourney.

Explorez cette fonctionnalité innovante dans Midjourney et commencez à créer des récits et des histoires visuelles plus cohérents !

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles