O popular serviço de geração de imagens por IA, Midjourney, lançou uma de suas funcionalidades mais requisitadas: a capacidade de recriar personagens de forma consistente em diferentes imagens. Essa habilidade representa um grande desafio para geradores de imagem por IA, principalmente por conta do uso de modelos de difusão. Ferramentas como o Stable Diffusion da Stability AI processam texto fornecido pelo usuário para criar imagens pixel a pixel, utilizando dados de um vasto conjunto de imagens criadas por humanos.
Por que Personagens Consistentes São Importantes na IA Generativa
Assim como os modelos de linguagem de grande escala (LLMs) como o ChatGPT da OpenAI, as aplicações de IA generativa frequentemente enfrentam dificuldades em manter a consistência. Cada solicitação resulta em uma saída única, mesmo com a reutilização das mesmas palavras-chave. Embora essa característica seja benéfica para gerar novo conteúdo, ela complica situações como o storyboard de filmes, romances, graphic novels ou quadrinhos, onde a continuidade e o reconhecimento dos personagens são cruciais.
Para atender a essa necessidade, o Midjourney lançou a tag “–cref” (abreviação de “referência de personagem”). Ao adicionar essa tag aos seus prompts de texto no Discord do Midjourney, os usuários podem referenciar um personagem de uma imagem previamente gerada. A IA tentará então corresponder às características faciais, tipo de corpo e vestuário do personagem com base na URL fornecida.
Como Usar a Funcionalidade de Personagens Consistentes do Midjourney
A tag “–cref” funciona melhor com imagens que já foram geradas no Midjourney. Aqui está um fluxo de trabalho passo a passo:
1. Gere ou encontre a URL de um personagem existente.
2. Por exemplo, vamos criar um personagem com o prompt: “um homem careca musculoso com barba e tapa olho.”
3. Após escolher sua imagem favorita, clique com o botão direito sobre ela no Discord do Midjourney para copiar o link.
4. Em seguida, você pode criar um novo prompt, como “vestindo um fraque branco em uma villa –cref [URL],” colando a URL copiada. O Midjourney tentará gerar o mesmo personagem em seu novo cenário.
Embora o resultado possa não corresponder exatamente ao personagem original ou ao prompt, os resultados são promissores. Os usuários também podem ajustar o grau de semelhança da nova imagem em relação à original usando a tag “–cw” seguida de um número entre 1 e 100. Um valor mais alto de “cw” significa uma correspondência mais próxima ao personagem original, enquanto um número menor permite mais variações.
Por exemplo, usar uma configuração baixa de “cw” de 8 pode resultar no fraque branco desejado, mas com a perda de características distintivas como o tapa olho—um detalhe que pode ser corrigido com alguns ajustes.
Combinando Personagens
Os usuários podem criar imagens com vários personagens usando duas tags “–cref” com suas respectivas URLs. Esse recurso foi lançado recentemente e artistas já estão explorando seu potencial.
Notas Oficiais
David Holz, fundador do Midjourney, compartilhou uma atualização sobre essa funcionalidade:
- Instruções de Uso: Adicione a tag “–cref URL” após seu prompt, onde a URL se refere a uma imagem de personagem.
- Ajustes de Força: Use “–cw” para modificar a força da referência, sendo 100 o padrão. Defini-la para 0 foca apenas nas características faciais.
- Foco no Personagem: Este recurso é projetado para personagens criados pelo Midjourney, não para indivíduos reais, e a precisão é limitada—não irá replicar detalhes menores como covinhas ou logotipos com exatidão.
- Compatibilidade de Modelos: O recurso “cref” funciona tanto para modelos Niji quanto para os modelos regulares do Midjourney.
Explore essa inovadora funcionalidade no Midjourney e comece a criar narrativas e histórias visuais mais coesas!