一种新兴的人工智能图像生成技术InstantID可以迅速识别并创作基于单一参考图像的图像。北京InstantX团队在近期的一篇论文中提出了这一技术。
企业人工智能顾问Reuven Cohen称InstantID是AI图像生成领域的“新一代技术”。然而,他警告说,随着2024年选举的临近,这项技术可能导致恶搞内容(音频、图像和视频)的激增。Cohen指出:“使用InstantID等工具制作深度伪造内容存在重大隐患,因为它的创建过程简单、输出一致,无需训练或微调。”他强调,InstantID可以用极少的计算资源生成高度逼真的深度伪造内容:“它能够高效生成保留身份特征的内容,几乎不需要CPU和GPU支持。”
InstantID与LoRA:重大进步
Cohen解释道,InstantID的性能优于LoRA,后者依赖于在特定参数(如特定角色或艺术风格)上微调的小型模型。尽管LoRA已经实现了从AI生成同人小说到逼真风格的各种创作,但它因生成色情和深伪内容而备受争议。Cohen在LinkedIn上表示:“再见,LoRA”,并指出InstantID可谓是“强化版深伪”。
InstantX团队的论文《InstantID:秒级零-shot身份保留生成》指出,现有像LoRA的方法因其对存储的高需求、广泛的微调要求以及需要多张参考图像而受到限制。相比之下,InstantID提供了一种“即插即用模块”,只需一张面部图像即可高效个性化生成各种风格的图像,同时确保高保真度。
Cohen解释说,InstantID旨在实现零-shot身份保留生成,这与现有技术如QLoRA大相径庭,后者通过简化模型数据以降低微调资源要求。虽然QLoRA曾是尖端技术,但他强调,InstantID的核心在于快速生成保留输入数据身份特征的输出。
简化深伪生成
InstantID的主要功能是保持生成内容中个体的身份特征。“想想一致性——就像唐纳德·特朗普总是看起来像唐纳德·特朗普一样,”他说。他警告说,制作深伪内容从未如此简单:“只需点击一下,您就可以在Hugging Face上部署或复制它。”
随着技术的发展,像InstantID这样的深伪工具的可及性引发了广泛的影响,带来了有关真实性和数字内容未来的重大疑问。