Una nueva técnica de generación de imágenes por IA llamada InstantID permite la identificación y creación rápida de imágenes a partir de una única imagen de referencia, según un reciente artículo del equipo de InstantX en Pekín.
Reuven Cohen, consultor de IA para empresas Fortune 500, se refiere a InstantID como la "nueva vanguardia" en la generación de imágenes por IA. Sin embargo, advierte que esta tecnología podría provocar un aumento en el contenido deepfake—audios, imágenes y videos—especialmente con las elecciones de 2024 a la vista.
Cohen comentó: “El uso de herramientas como InstantID para deepfakes plantea preocupaciones significativas debido a la facilidad de creación y la consistencia en los resultados, sin necesidad de capacitación o ajuste fino”. Destacó que InstantID puede generar deepfakes muy realistas con recursos computacionales mínimos: “Puede crear contenido que preserva la identidad de manera eficiente con poco uso de CPU y sin necesidad de GPU”.
InstantID vs. LoRA: Un Avance Importante
Cohen explica que InstantID supera a LoRA, que implica modelos pequeños y ajustados que se entrenan en parámetros limitados, como personajes específicos o estilos artísticos. Aunque LoRA ha permitido una amplia gama de creaciones, desde ficción generada por IA hasta fotorealismo, es polémicamente conocida por producir pornografía y deepfakes.
En una publicación en LinkedIn, Cohen expresó: “Adiós, LoRA”, señalando que InstantID representa “deepfakes en esteroides”.
El artículo del equipo de InstantX, titulado InstantID: Generación de Preservación de Identidad en Cero Tiempos, establece que métodos existentes como LoRA enfrentan limitaciones debido a la alta necesidad de almacenamiento, el extenso ajuste fino y la necesidad de múltiples imágenes de referencia. En contraste, InstantID ofrece un "módulo plug and play" que personaliza imágenes de manera eficiente en diversos estilos usando solo una imagen facial, garantizando alta fidelidad.
Cohen explica que InstantID está diseñado para la generación de preservación de identidad en cero tiempos, lo cual es fundamentalmente diferente de técnicas existentes como QLoRA, que simplifican los datos del modelo para disminuir los requisitos de recursos para el ajuste fino. Mientras que QLoRA era el método de vanguardia anteriormente, enfatiza que el enfoque de InstantID está en generar rápidamente resultados que mantengan las características de identidad de los datos de entrada.
Simplificando la Creación de Deepfakes
La función principal de InstantID es mantener la identidad de las personas en el contenido generado. “Piensa en la consistencia—como Donald Trump que siempre se ve como Donald Trump”, observó. Advirtió que crear deepfakes nunca ha sido tan fácil: “Con solo un clic, puedes implementarlo en Hugging Face o replicarlo”.
A medida que la tecnología avanza, las implicaciones de herramientas accesibles de deepfake como InstantID son vastas, planteando preguntas importantes sobre la autenticidad y el futuro del contenido digital.