قدم باحثو آبل أداة مبتكرة تُدعى "Keyframer"، وهي أداة ذكاء اصطناعي تستخدم نماذج اللغة الكبيرة (LLMs) لتحريك الصور الثابتة بناءً على التعليمات النصية. يمثل هذا التطبيق الرائد، الذي تم تقديمه في ورقة بحثية على arxiv.org بعنوان "Keyframer: Empowering Animation Design using Large Language Models"، تقدماً كبيراً في دمج الذكاء الاصطناعي في سير العمل الإبداعي، مما قد يؤثر على منتجات آبل المستقبلية مثل iPad Pro وVision Pro.
تعتمد Keyframer على نموذج لغة كبير، وهو GPT-4، الذي ينشئ كود CSS لتحريك الصور الثابتة من صور SVG وتعليمات نصية. يبرز البحث التحديات التي تواجه تطبيق LLMs في الرسوم المتحركة، خاصة فيما يتعلق بكيفية وصف المستخدمين للحركة بلغة طبيعية بفعالية.
تخيل أنك رسام متحرك ولديك فكرة في ذهنك. لديك صور ثابتة وروائية، ولكن التفكير في قضاء ساعات في التحريك على iPad قد يكون مرعبًا. هنا تأتي Keyframer: باستخدام بضع جمل موجزة، تصبح صورك حية على الشاشة، كما لو كانت فكرتك تُفسر بسلاسة بواسطة نماذج آبل اللغوية.
تتيح الأداة للمستخدمين تحميل صورة SVG، وإدخال أمر مثل "اجعل السحب تنجرف ببطء إلى اليسار"، واستلام كود التحريك الناتج. يمكن للمستخدمين تحسين الرسوم المتحركة عن طريق تعديل كود CSS أو من خلال إضافة تعليمات جديدة. تلاحظ الورقة البحثية أن "Keyframer تدعم استكشاف وتحسين الرسوم المتحركة من خلال مزيج من التعليمات والتحرير المباشر للناتج". وقد شُكل هذا النهج الذي يركز على المستخدم من خلال مقابلات مع رسامين محترفين ومهندسين، مما يبرز أهمية التصميم التكراري والإبداع.
علق أحد المشاركين قائلاً: "أعتقد أن هذا كان أسرع بكثير من العديد من الطرق التي استخدمتها... كنت سأمضي ساعات في مهام مماثلة من قبل."
تشجع Keyframer المستخدمين على اعتماد نهج تكراري، "مجزأ" لتصميم التعليمات، مما يمكنهم من تعديل الأهداف استنادًا إلى ردود الذكاء الاصطناعي. يلاحظ الباحثون أن "Keyframer مكنت المستخدمين من تحسين تصميماتهم بشكل تكراري من خلال التعليمات المتسلسلة، بدلاً من الاضطرار إلى النظر في تصميمهم بالكامل دفعة واحدة". توفر ميزات تحرير الكود المباشر تحكماً إبداعياً تفصيلياً.
بينما يمكن لأدوات الرسوم المتحركة بالذكاء الاصطناعي أن تجعل التصميم متاحاً للجميع، تظل المخاوف بشأن فقدان السيطرة الإبداعية. تسعى Keyframer لتحقيق التوازن بين النمذجة الإبداعية والوصول السهل من خلال الجمع بين التعليمات والتحرير.
يختتم الباحثون: "من خلال هذا العمل، نأمل في إلهام أدوات تصميم الرسوم المتحركة المستقبلية التي تمزج بين القدرات التوليدية لنماذج اللغة الكبيرة والمحررين الديناميين، مما يسمح للمبدعين بالاحتفاظ بالتحكم في تصميماتهم".
تستعد Keyframer لثورة في مشهد الرسوم المتحركة، مما يجعلها أكثر سهولة لمجموعة واسعة من المبدعين—تمكين غير الخبراء من تحريك القصص التي كانت تتطلب مهارات تقنية واسعة. يُشير هذا إلى تحول في العملية الإبداعية، حيث يظهر الذكاء الاصطناعي كشريك تعاوني.
قد تؤدي الآثار الأوسع لـ Keyframer إلى تحول ثقافي، مما يجعل الذكاء الاصطناعي جزءاً أكثر حدسية من تجربة الإبداع. لا يُعتبر هذا التقدم مجرد خطوة تكنولوجية للأمام، بل هو عامل محفز لإعادة تعريف كيفية تفاعلنا مع العالم الرقمي. قد تمثل مقدمة آبل لـ Keyframer فجر عصر جديد حيث تتلاشى الفجوة بين المبدع والإبداع، موجهة بقدرات الذكاء الاصطناعي.