Uma nova técnica de geração de imagens com IA, chamada InstantID, permite a identificação rápida e a criação de imagens a partir de uma única imagem de referência, de acordo com um artigo recente da equipe da InstantX, em Pequim.
Reuven Cohen, consultor de IA para empresas da Fortune 500, descreve o InstantID como o “novo estado da arte” na geração de imagens com IA. No entanto, ele alerta que essa tecnologia pode levar a um aumento de conteúdo deepfake — áudios, imagens e vídeos — especialmente com as eleições de 2024 se aproximando.
Cohen afirmou: “O uso de ferramentas como o InstantID para deepfakes levanta preocupações significativas devido à facilidade de criação e à consistência da saída, que não requer treinamento ou ajuste.” Ele destacou que o InstantID pode produzir deepfakes altamente realistas com recursos computacionais mínimos: “É capaz de gerar conteúdo que preserva a identidade de forma eficiente, utilizando pouca CPU e sem necessidade de GPU.”
InstantID vs. LoRA: Um Grande Avanço
Cohen explicou que o InstantID supera o LoRA, que envolve modelos pequenos e ajustados treinados em parâmetros limitados, como personagens específicos ou estilos artísticos. Embora o LoRA tenha possibilitado uma ampla gama de criações, de fanfics gerados por IA a fotorealismo, é controversamente mais conhecido por produzir pornografia e deepfakes. Em um post no LinkedIn, Cohen comentou: “Até logo, LoRA”, observando que o InstantID representa “deepfakes potencializados”.
O artigo da equipe InstantX, intitulado InstantID: Geração de Identidade Preservada em Tempo Zero, afirma que métodos existentes como o LoRA enfrentam limitações devido à alta necessidade de armazenamento, extensos ajustes e a exigência de várias imagens de referência. Em contraste, o InstantID oferece um 'módulo plug-and-play' que personaliza eficientemente imagens em vários estilos usando apenas uma imagem facial, mantendo alta fidelidade.
Cohen explica que o InstantID é projetado para geração de identidade preservada em zero-shot, que é fundamentalmente diferente das técnicas existentes, como o QLoRA, que simplificam os dados do modelo para diminuir os requisitos de recursos para ajustes. Enquanto o QLoRA era anteriormente o método de ponta, ele enfatiza que o foco do InstantID é gerar rapidamente saídas que preservam as características de identidade dos dados de entrada.
Simplificando a Criação de Deepfakes
A função principal do InstantID é manter a identidade das pessoas no conteúdo gerado. “Pense na consistência — como Donald Trump sempre parece Donald Trump”, ele observou. Cohen advertiu que criar deepfakes nunca foi tão fácil: “Com apenas um clique, você pode implementar isso no Hugging Face ou replicar.”
À medida que a tecnologia evolui, as implicações das ferramentas de deepfake acessíveis como o InstantID são vastas, levantando questões importantes sobre autenticidade e o futuro do conteúdo digital.