최근 베이징의 InstantX 팀이 발표한 논문에 따르면, InstantID라는 새로운 AI 이미지 생성 기술이 단일 참조 이미지를 기반으로 신속하게 이미지를 식별하고 생성할 수 있게 한다. 포춘 500대 기업을 위한 AI 컨설턴트인 루벤 코헨은 InstantID를 AI 이미지 생성의 "최첨단 기술"로 언급하며, 2024년 선거를 앞두고 이 기술이 딥페이크 콘텐츠—오디오, 이미지, 비디오—의 급증을 초래할 수 있다고 경고했다.
코헨은 "InstantID와 같은 도구를 이용한 딥페이크 제작은 생성의 용이성과 출력의 일관성 때문에 심각한 우려를 불러일으킨다. 교육이나 세부 조정이 필요 없다"고 말했다. 그는 InstantID가 최소한의 컴퓨팅 자원으로 매우 사실적인 딥페이크를 생성할 수 있음을 강조하며, "CPU도 필요 없고 GPU 없이도 효율적으로 신원 보존 콘텐츠를 생성할 수 있다"고 덧붙였다.
InstantID vs. LoRA: 주요 발전
코헨은 InstantID가 특정 캐릭터 또는 예술 스타일과 같은 제한된 매개변수로 훈련된 소형 모델을 사용하는 LoRA보다 우수하다고 설명했다. LoRA는 AI가 생성한 팬 픽션에서 사진처럼 사실적인 이미지까지 다양한 창작을 가능하게 했으나, 논란의 여지가 있는 성인 콘텐츠 및 딥페이크 제작으로 잘 알려져 있다.
LinkedIn 게시물에서 코헨은 "이제 LoRA는 안녕,"이라고 언급하며 InstantID가 "스테로이드에 의한 딥페이크"를 나타낸다고 말했다. InstantX 팀의 논문인 'InstantID: Zero-shot Identity-Preserving Generation in Seconds'에 따르면, LoRA와 같은 기존 방법은 높은 저장 공간 요구, 광범위한 세부 조정, 여러 참조 이미지 필요성 등의 한계를 지닌다. 반면, InstantID는 단 하나의 얼굴 이미지를 사용해 다양한 스타일의 이미지를 효율적으로 개인화할 수 있는 '플러그 앤 플레이 모듈'을 제공하며, 고충실도를 유지한다.
코헨은 InstantID가 기존의 QLoRA와는 근본적으로 다른 제로샷 신원 보존 생성을 위해 설계되었다고 설명했다. QLoRA가 자원 요구를 줄이기 위해 모델 데이터를 단순화했지만, InstantID는 입력 데이터의 신원 특성을 유지하면서 신속하게 출력을 생성하는 데 초점을 맞추고 있다고 강조했다.
딥페이크 생성 간소화
InstantID의 주요 기능은 생성된 콘텐츠에서 개인의 신원을 유지하는 것이다. "일관성에 대해 생각해보라—도널드 트럼프가 항상 도널드 트럼프처럼 보이는 것과 같다"고 그는 언급했다. 딥페이크 생성이 그 어느 때보다 쉬워졌음을 경고하며, "한 번의 클릭으로 Hugging Face에 배포하거나 복제할 수 있다"고 말했다.
기술이 발전함에 따라 InstantID와 같은 접근 가능한 딥페이크 도구의 의미는 막대하며, 진위 및 디지털 콘텐츠의 미래에 대한 중요한 질문을 제기하고 있다.