تقنية جديدة لتوليد الصور بالذكاء الاصطناعي تُدعى InstantID تتيح تحديد وإنشاء الصور بسرعة استنادًا إلى صورة مرجعية واحدة، وفقًا لورقة بحثية حديثة قدمها فريق InstantX في بكين. يُشير روفن كوهين، مستشار الذكاء الاصطناعي للشركات الكبرى، إلى أن InstantID يمثل "التكنولوجيا المتطورة الجديدة" في مجال توليد الصور. ومع ذلك، يحذر من أن هذه التقنية قد تؤدي إلى زيادة في محتوى "ديب فيك" (deepfake) — سواء كان صوتًا أو صورًا أو مقاطع فيديو — خاصة مع اقتراب الانتخابات لعام 2024.
علق كوهين قائلاً، "إن استخدام أدوات مثل InstantID في إنشاء ديب فيك يثير مخاوف كبيرة بسبب سهولة الإنتاج وانتظام المخرجات، دون الحاجة إلى تدريب أو ضبط دقيق." وأبرز أن InstantID يمكن أن ينتج ديب فيك واقعي للغاية مع كمية قليلة من الموارد الحاسوبية: “يمكنه بكفاءة توليد محتوى يحافظ على الهوية مع القليل من CPU ودون الحاجة إلى طاقة GPU."
InstantID مقابل LoRA: تقدم رئيسي
يشرح كوهين أن InstantID يتفوق على LoRA، الذي يعتمد على نماذج دقيقة صغيرة تم تدريبها على معلمات محدودة مثل شخصيات أو أنماط فنية معينة. بينما تمكنت LoRA من إنتاج مجموعة واسعة من الإبداعات، من الأدب الفني الذي أنشأه الذكاء الاصطناعي إلى الصور الواقعية، فإنها مشهورة بشكل مثير للجدل بإنتاج المواد الإباحية وديب فيك. في منشور على لينكد إن، قال كوهين، "وداعًا، LoRA"، مشيرًا إلى أن InstantID يمثل "ديب فيك المحسن."
توضح ورقة فريق InstantX، بعنوان InstantID: توليد محتوى يحافظ على الهوية في ثوانٍ، أن الأساليب الحالية مثل LoRA تواجه قيودًا بسبب احتياجات التخزين العالية، والتدقيق المكثف، ومتطلبات استخدام صور مرجعية متعددة. بالمقابل، يوفر InstantID "وحدة توصيل وتشغيل" تُخصص الصور بكفاءة في أنماط مختلفة باستخدام صورة وجه واحدة فقط، مع ضمان دقة عالية.
يشرح كوهين أن InstantID مصمم لتوليد محتوى يحافظ على الهوية من دون الحاجة إلى تدريب مسبق، وهو مختلف تمامًا عن الأساليب الحالية مثل QLoRA التي تُبسط بيانات النموذج لتقليل متطلبات الموارد للتدقيق. بينما كانت QLoRA سابقًا هي الطريقة الرائدة، يؤكد كوهين أن تركيز InstantID ينصب على إنتاج مخرجات بسرعة تحتفظ بخصائص الهوية لبيانات الإدخال.
تبسيط إنشاء ديب فيك
تتمثل الوظيفة الأساسية لـ InstantID في الحفاظ على هوية الأفراد في المحتوى المُنتج. "فكر في الاستمرارية — مثل الطريقة التي يبدو بها دونالد ترامب دائمًا،" أشار كوهين. وحذر من أن إنشاء ديب فيك لم يكن أسهل من ذلك: "بضغطة واحدة، يمكنك نشر هذا على Hugging Face أو تكراره."
مع تطور التكنولوجيا، فإن تداعيات أدوات ديب فيك المتاحة مثل InstantID واسعة، مما يثير تساؤلات مهمة حول الأصالة ومستقبل المحتوى الرقمي.