Une nouvelle technique de génération d'images par IA, appelée InstantID, permet une identification et une création rapides d'images à partir d'une seule image de référence, selon un récent article de l'équipe InstantX à Pékin.
Reuven Cohen, consultant en IA pour des entreprises du Fortune 500, qualifie InstantID de « nouvelle référence » dans la génération d'images par IA. Cependant, il met en garde contre le risque d'une augmentation des contenus deepfake — audio, images et vidéos — surtout avec l'élection de 2024 qui approche. Cohen a déclaré : « L'utilisation d'outils comme InstantID pour réaliser des deepfakes soulève des préoccupations majeures en raison de la simplicité de création et de la cohérence des résultats, sans nécessiter d'entraînement ni d'ajustement. » Il a souligné qu'InstantID peut produire des deepfakes très réalistes en utilisant peu de ressources informatiques : « Il peut générer efficacement des contenus préservant l'identité avec peu de puissance CPU et sans besoin de GPU. »
InstantID contre LoRA : Un Progrès Majeur
Cohen explique qu'InstantID surpasse LoRA, qui implique des modèles petits et ajustés, entraînés sur des paramètres limités comme des personnages spécifiques ou des styles artistiques. Bien que LoRA ait permis une large gamme de créations, allant de la fan fiction générée par IA au photoréalisme, elle est controversée pour sa production de pornographie et de deepfakes. Dans un post sur LinkedIn, Cohen a remarqué : « Au revoir, LoRA », indiquant qu'InstantID représente « des deepfakes sous stéroïdes. »
Le document de l'équipe InstantX, intitulé InstantID : Génération préservant l'identité en zéro-shot en secondes, souligne que les méthodes existantes comme LoRA rencontrent des limites dues à des besoins de stockage élevés, à un ajustement étendu et à la nécessité d'images de référence multiples. En revanche, InstantID propose un module 'plug and play' qui personnalise efficacement des images dans divers styles en utilisant une seule image faciale, tout en assurant une haute fidélité.
Cohen précise qu'InstantID est conçu pour la génération d'identité préservée en zéro-shot, ce qui est fondamentalement différent des techniques existantes comme QLoRA, qui simplifient les données du modèle pour réduire les besoins en ressources pour l'ajustement. Bien que QLoRA ait été la méthode de pointe auparavant, il souligne que l'accent d'InstantID est mis sur la génération rapide de résultats qui conservent les caractéristiques d'identité des données d'entrée.
Simplifier la Création de Deepfakes
La fonction principale d'InstantID est de maintenir l'identité des individus dans le contenu généré. « Pensez à la cohérence — comme Donald Trump qui ressemble toujours à Donald Trump », a-t-il noté. Il a averti que la création de deepfakes n'a jamais été aussi facile : « Avec un seul clic, vous pouvez le déployer sur Hugging Face ou le répliquer. »
À mesure que la technologie évolue, les implications des outils deepfake accessibles, comme InstantID, sont vastes, soulevant des questions importantes sur l'authenticité et l'avenir du contenu numérique.