أعلنت شركة Synthesia، الناشئة التي تتخذ من لندن مقراً لها والمتخصصة في إنشاء الفيديوهات باستخدام الذكاء الاصطناعي للمؤسسات، عن تحسين منصتها بتقديم "الأفاتار التعبيرية".
ابتداءً من اليوم، تعمل هذه الأفاتار الذكية على تعزيز قدرات الأفاتار الرقمية التقليدية من خلال تعديل نبرتها وتعبيرات وجهها ولغة جسدها بناءً على سياق المحتوى. تأتي هذه الإطلاق بعد عرض Microsoft الأخير لـ VASA، وهو إطار عمل ذكاء اصطناعي يحول الصور الرأسية البشرية إلى فيديوهات متحركة تتحدث وتغني مع تعبيرات وحركات رأس. ومع ذلك، وعلى عكس VASA، الذي لا يزال مشروعاً بحثياً، توفر الأفاتار التعبيرية لشركة Synthesia تقنية حقيقية تهدف إلى مساعدة المؤسسات في إنشاء فيديوهات ذكاء اصطناعي أكثر واقعية لجمهورها.
قفزة Synthesia المبتكرة في الفيديوهات الذكية
تأسست شركة Synthesia في عام 2017 على يد باحثين ورواد أعمال في الذكاء الاصطناعي من ستانفورد وكامبريدج. قامت بتطوير منصة شاملة تجمع بين الأصوات والأفاتار الذكية المخصصة. يمكن للمستخدمين إنشاء فيديوهات ذكاء اصطناعي بجودة استوديو باستخدام نصوص مكتوبة مسبقاً أو محتوى مُنتَج بواسطة الذكاء الاصطناعي، مما ساهم في اعتماد كبير عبر المؤسسات. أنشأ أكثر من 200,000 مستخدم أكثر من 18 مليون فيديو، على الرغم من أن الأفاتار السابقة لم تكن قادرة على نقل المشاعر بفعالية، إذ لم يكن بالإمكان تعديل نبرتها أو تعبيراتها بناءً على النص في الوقت الحقيقي.
مع إطلاق الأفاتار التعبيرية، تم معالجة هذه الحدود.
تشير Synthesia إلى أن الأفاتار الذكية الجديدة يمكنها فهم المشاعر والسياق داخل النص، وتعديل نبرتها وتعبيرات وجهها وفقًا لذلك. يمكنها نقل مجموعة من المشاعر من خلال تغييرات دقيقة في التعبيرات، والوميض، وحركات العين. على سبيل المثال، قد يبتسم الأفاتار عند مناقشة موضوع مبهج أو يبطئ من حديثه مع توقفات أطول للمحتوى الجاد.
قال جون ستارك، المدير التقني لشركة Synthesia، في منشور مدونة: "هدفنا ليس مجرد إنشاء نماذج رقمية، بل تقديم ممثلين رقميين. تعزز هذه التقنية من واقعية الأفاتار الرقمية، مما يمحو الفجوة بين العالم الافتراضي والواقع".
الأساس الفني للأفاتار التعبيرية
لتحقيق هذا الفهم الدقيق للمشاعر، تستخدم Synthesia نموذج التعلم العميق EXPRESS-1، الذي تم تدريبه على مجموعة واسعة من البيانات النصية والفيديو تعكس التواصل البشري في العالم الحقيقي.
وأوضح ستارك: "يتنبأ EXPRESS-1 بالحركات وتعبيرات الوجه في الوقت الحقيقي، متماشياً تمامًا مع الفروق الدقيقة في الكلام والتأكيد، مما يؤدي إلى أداء طبيعي للغاية". تتميز الأفاتار الجديدة أيضًا بتحسينات في مزامنة الشفاه وقدرات الصوت عبر لغات متعددة.
آثار الأفاتار التعبيرية
بينما تمثل الأفاتار الذكية بمشاعر إنسانية مخاطر محتملة لسوء الاستخدام، تلتزم Synthesia بتعزيز التطبيقات الإيجابية للمؤسسات، خصوصًا في مجالات الاتصال ومشاركة المعرفة. على سبيل المثال، يمكن للشركات في قطاع الرعاية الصحية استخدام الأفاتار التعبيرية لإنتاج فيديوهات أكثر تعاطفًا مع المرضى، بينما قد تنقل الفرق التسويقية حماسها لمنتج جديد.
للترويج للاستخدام المسؤول، قامت Synthesia بمراجعة سياساتها لتقييد أنواع المحتوى على منصتها وتستثمر بنشاط في الكشف المبكر عن سوء الاستخدام وتقنيات تحقق المحتوى مثل C2PA.
حاليًا، مع قوة عمل تتكون من 300 موظف، تتعاون Synthesia مع أكثر من 55,000 شركة، بما في ذلك نصف شركات Fortune 100. ومن بين عملائها شركة Zoom، التي أفادت بزيادة قدرها 90% في الكفاءة لإنتاج فيديوهات المبيعات والتدريب باستخدام Synthesia.