مؤخراً، حظي نموذج الفيديو الذكي StreamingT2V، الذي تم تطويره من قبل فريق Picsart AI Research وآخرين، باهتمام كبير في الصناعة. هذا النموذج وضع معايير جديدة في إنتاج الفيديو، حيث يمكنه إنتاج مقاطع فيديو تصل مدتها إلى دقيقتين (1200 إطار). ويتفوق تقنياً على النموذج المعروف Sora، مما ينعش النظام البيئي مفتوح المصدر بفضل طبيعته المجانية.
يمثل إطلاق StreamingT2V خطوة محورية في مجال إنتاج الفيديو. حتى الآن، كانت معظم النماذج محدودة في إنتاج مقاطع فيديو تتراوح مدتها من ثوانٍ قليلة إلى دقيقة واحدة، بينما تميز Sora بقدرتها على إنتاج مقاطع تصل إلى 60 ثانية. الآن، يتيح StreamingT2V تمديد إنتاج الفيديو إلى دقيقتين، مع إمكانية إنتاج مقاطع بأطوال غير محدودة تقريباً، مما يفتح آفاقاً جديدة في إنشاء الفيديو.
يعزى نجاح هذا النموذج إلى هيكلية متقدمة تعتمد على الآلية التلقائية. تم تصميم StreamingT2V لإنتاج فيديوهات طويلة غنية وديناميكية مع الحفاظ على التناسق الزمني وجودة الصورة على مستوى الإطار. من خلال دمج وحدة انتباه شرطية (CAM) ووحدة الحفاظ على المظهر (APM)، يتعامل هذا النموذج بفعالية مع مشكلات تدهور الجودة والأداء الصلب التي تواجه نماذج التحويل من النص إلى الفيديو عندما يتم توسيع المدة.
تعمل وحدة CAM كجزء من الذاكرة القصيرة المدى، حيث تضبط إنتاج الفيديو من خلال آليات الانتباه لضمان انتقالات طبيعية بين مقاطع الفيديو. بينما تقوم وحدة APM بدور الذاكرة الطويلة المدى، حيث تستخرج ميزات المشهد والكائنات من المقطع الأولي للحفاظ على التناسق طوال عملية الإنتاج. بالإضافة إلى ذلك، يستخدم StreamingT2V تقنيات توليد نصوص عالية الدقة لتعزيز جودة الفيديو بشكل أكبر.
حالياً، يتوفر StreamingT2V كمصدر مفتوح على GitHub ويوفر تجربة مجانية على منصة Hugging Face. على الرغم من أن المستخدمين قد يواجهون بعض أوقات الانتظار بسبب ضغط الخادم، إلا أن عملية إدخال النصوص وصور التوجيه لإنشاء الفيديو تظل مثيرة. تعرض منصة Hugging Face العديد من الأمثلة الناجحة، مما يبرز الإمكانيات الرائعة لـ StreamingT2V في إنتاج الفيديو.
لا يمثل تقديم StreamingT2V مجرد قفزة تكنولوجية في إنتاج الفيديو، بل يمنح مجتمع المصدر المفتوح أداة قوية تعزز من التطوير المستمر في التقنيات ذات الصلة. مع استمرار التطورات والابتكارات مثل StreamingT2V في الانتشار، قد نشهد زيادة في استخدام مقاطع الفيديو عالية الجودة وطويلة المدة التي تم إنشاؤها بواسطة الذكاء الاصطناعي في مجالات متعددة، بما في ذلك إنتاج الأفلام، وتطوير الألعاب، وإنشاء العوالم الافتراضية. سيلعب مجتمع المصدر المفتوح دوراً حاسماً في هذه التطورات التكنولوجية، مما سيعزز التقدم والتطوير المستمر.