اختتم مارك زوكربيرغ، مؤسس والرئيس التنفيذي لشركة ميتا، الأسبوع بطريقة مميزة من خلال مشاركة فيديو على حسابه الشخصي في إنستغرام، يظهر فيه وهو يمارس تمارين الضغط على الساق في صالة الألعاب الرياضية. وقد كانت هذه الشبكة الاجتماعية، التي استحوذت عليها ميتا في عام 2012، خلفية مثالية لإعلان بارز.
في الفيديو، تتحول آلة الضغط على الساق إلى إصدارات لافتة للنظر: نموذج نيون سيبر بانك، وإصدار روماني قديم، ونسخة مشتعلة بالذهب.
تقديم موفي جين
ممارسة زوكربيرغ الرياضية كانت بمثابة الظهور الأول لموفي جين، مجموعة ميتا المبتكرة من نماذج الذكاء الاصطناعي التوليدية متعددة الوسائط، القادرة على إنشاء فيديو وصوت من نصوص محددة. يمكن للمستخدمين تخصيص مقاطع الفيديو الخاصة بهم بتأثيرات خاصة وأكسسوارات وتكاليف من خلال تعليمات نصية بسيطة، كما أوضح زوكربيرغ في منشوره.
تتيح النماذج المتطورة للمستخدمين تعديل عناصر محددة من مقاطع الفيديو بدلاً من إعادة توليدها بالكامل، وهي ميزة تميزها عن نماذج الذكاء الاصطناعي السابقة. تُظهر الاختبارات الداخلية التي أجرتها ميتا، كما هو مفصل في ورقة تقنية حديثة، أن موفي جين تتفوق على المنافسين مثل Runway Gen 3 وLuma Dream Machine وOpenAI Sora وKling 1.5 من حيث التناسق وطبيعة الحركة.
تطبيقات متعددة الاستخدامات
تسعى ميتا لوضع موفي جين كأداة ضرورية لكل من المستخدمين العاديين والمبدعين المحترفين، بما في ذلك صانعي الأفلام في هوليوود.
الميزات الرئيسية لموفي جين
1. موفي جين فيديو: نموذج قوي يتضمن 30 مليار معلمة لتوليد الفيديو من النص.
2. موفي جين صوت: نموذج يحتوي على 13 مليار معلمة لتوليد الصوت من الفيديو.
3. موفي جين فيديو مخصص: توليد مقاطع فيديو مخصصة استنادًا إلى الصور المقدمة من المستخدمين.
4. موفي جين تحرير: نموذج مصمم لتحرير الفيديو بدقة، مما يسمح بتعديلات محلية وتغيير الخلفيات.
يمكن للمستخدمين إنتاج مقاطع فيديو بدقة عالية تصل إلى 16 ثانية بمعدل 16 إطارًا في الثانية مع صوت متزامن بتردد 48 كيلوهرتز.
قدرات وسائط متقدمة
يوفر موفي جين عملية إبداعية سلسة بفضل ميزات مثل:
- إنتاج فيديو عالي الجودة: يمكن للمستخدمين إنشاء مقاطع فيديو بدقة عالية من خلال إدخال نصوص بسيطة، مع القدرة على تحقيق دقة 1080 بكسل والحفاظ على التفاصيل المعقدة مثل حركة الكاميرا وتفاعلات الأشياء.
- إنشاء محتوى مخصص: من خلال تحميل الصور الشخصية، يمكن للمستخدمين الظهور في مقاطع فيديو تم إنشاؤها بواسطة الذكاء الاصطناعي مع الحفاظ على هويتهم خلال مختلف التعديلات النصية.
- تحرير الفيديو بكفاءة: يمكن للمستخدمين إجراء تغييرات محددة داخل مقاطع الفيديو، مثل تعديل الألوان أو الأجسام، باستخدام أوامر نصية بسيطة.
- توليد صوت متزامن: يتضمن مجموعة موفي جين نموذج صوت متقدم يسمح بإنشاء مؤثرات صوتية وموسيقى خلفية تتماشى مع المرئيات.
ابتكار يعتمد على البيانات
يبني موفي جين على كميات هائلة من البيانات التي جمعتها ميتا من الإنترنت، مستفيدًا من 100 مليون مقطع فيديو و1 مليار صورة للتدريب. ومع ذلك، واجهت ميتا تدقيقًا بشأن شرعية مصادر بياناتها، مما أثار نقاشات مستمرة حول حقوق الطبع والنشر وحقوق المستخدمين في تطوير الذكاء الاصطناعي.
تحسين طرق تدريب الذكاء الاصطناعي
تجمع ميتا بين هياكل نموذج الانتشار التقليدية وتقنية جديدة تُدعى "تطابق التدفق"، تهدف إلى تعزيز كفاءة التدريب وجودة المخرجات. تشمل المزايا الرئيسية:
- نسبة إشارة إلى ضوضاء صفرية: يحتفظ تطابق التدفق بطبيعة نسبة الإشارة إلى الضوضاء دون تعديلات إضافية، مما يحسن من تماسك مخرجات الفيديو.
- كفاءة التدريب والاستدلال: يوفر هذا الأسلوب مرونة أكبر مع جداول الضوضاء، مما يؤدي إلى أداء أفضل عبر أحجام مختلفة من النماذج وتوافق مع التقييمات البشرية.
آفاق المستقبل
من المقرر إطلاق موفي جين على إنستغرام في 2025، مع هدف جعل إنشاء الفيديوهات المتقدمة متاحًا لقاعدة مستخدمين متنوعة. ومع استمرار ميتا في تحسين التكنولوجيا، ستظل التعاون مع المبدعين وصانعي الأفلام أمرًا حيويًا لتحسين ميزات المجموعة.
تتطلع ميتا إلى أن يُحقق موفي جين ديمقراطية أدوات التحرير المتقدمة، مما يكمل عمل الفنانين المحترفين في حين يعزز من الخيارات الإبداعية لجميع المستخدمين. ومع تقدم التطوير، قد تشمل التطبيقات المحتملة تحيات متحركة مخصصة وأفلام قصيرة يقودها المستخدمون.
إن إطلاق موفي جين يعد بإعادة تشكيل إنشاء المحتوى على منصات ميتا، مع كون مستخدمي إنستغرام من بين الأوائل الذين يستفيدون من هذه التكنولوجيا الرائدة. مع تطورها، قد يصبح موفي جين أداة لا غنى عنها لكل من المبدعين المحترفين والمستقلين على حد سواء.