أصبح فن الذكاء الاصطناعي التوليدي واحدًا من أكثر التطبيقات إثارة وشعبية للتكنولوجيا الجديدة، حيث جذب ملايين المستخدمين إلى منصات مثل Stable Diffusion وMidjourney. وقد قامت OpenAI مؤخرًا بدمج نموذج DALL-E 3 لتوليد الصور في خدمة ChatGPT المُستخدمة على نطاق واسع، مما يسهل أكثر من أي وقت مضى توليد الصور. من خلال إدخال وصف بسيط، يمكن للمستخدمين مشاهدة كيفية تحويل خوارزميات الذكاء الاصطناعي لأفكارهم إلى فن بصري في لحظات.
ومع ذلك، في عالمنا السريع، قد يبدو الانتظار لبضع ثوانٍ لتوليد الصورة أمرًا مزعجًا. وهذا الأسبوع، تكثر الأحاديث في مجتمع فن الذكاء الاصطناعي حول تقنية تعلم الآلة الرائدة المعروفة باسم LCM-LoRA، أو نموذج الاتساق الكامن - التكيف منخفض الرتبة. تم تطوير هذه التقنية من قبل باحثين في جامعة تسينغوا ومنصة HuggingFace لمشاركة الأكواد، مما يتيح إنشاء فن الذكاء الاصطناعي بشكل مباشر.
ما معنى ذلك عمليًا؟ تحقق من مقاطع الفيديو التي شاركها فنانو الذكاء الاصطناعي على X وLinkedIn لرؤيتها تعمل في الوقت الفعلي.
مع LCM-LoRA، يمكن للمستخدمين الآن رسم أشكال بسيطة أو رسومات أشخاص بشكل سريع جنبًا إلى جنب مع نصوص وصفية، وتقوم تطبيقات إنشاء فن الذكاء الاصطناعي مثل Krea.AI وFal.AI بتوليد أعمال فنية جديدة على الفور. يمكن تعديل الصور تقريبًا في الحال بينما يقوم المستخدمون بتحريك أشكالهم ورسوماتهم على القماش الرقمي. يمكنك تجربتها بنفسك في Fal.AI (إذا استمر الموقع في العمل بشكل مستقر خلال حركة المرور العالية).
تعمل تقنية LCM-LoRA مع الصور ثنائية الأبعاد والأصول ثلاثية الأبعاد، مما يمكّن الفنانين من إنشاء بيئات غامرة بسرعة للاستخدام في الواقع المعزز (AR) والواقع الافتراضي (VR) وألعاب الفيديو، وربما إنتاج الأفلام، مما يسرع بشكل كبير من العملية الإبداعية ويقلل التكاليف.
"كل شيء سيتغير"، قال مؤسس إحدى الشركات الناشئة وهو مهندس سابق في Google AI على LinkedIn، وهو شعور يتقاسمه الكثيرون في مجتمع فن الذكاء الاصطناعي. علق مستخدم آخر على X قائلًا: "عصر جديد تمامًا من الذكاء الاصطناعي التوليدي على وشك الانطلاق." وأعرب البروفيسور إيثان مولك من مدرسة وارتون للأعمال عن أنه "سنرى الكثير من التجارب الجديدة قريبًا" بفضل هذه التقنية.
ما هي LCM-LoRA وكيف تعمل؟
تُظهر العروض الأولية لتكامل LCM-LoRA في التطبيقات أنها مثيرة بالفعل، مما يشير إلى نقطة تحول محتملة للذكاء الاصطناعي التوليدي في الفنون البصرية.
ما هي الابتكار التكنولوجي وراء LCM-LoRA؟ وفقًا للباحثين، LCM-LoRA هو "وحدة تسريع غير قائمة على التدريب الشامل" يمكن دمجها في نماذج مختلفة معدلة من Stable Diffusion.
بعبارة أبسط، هو خوارزمية تسرع عملية تحويل النصوص أو الصور إلى أعمال فنية جديدة مولدة بواسطة الذكاء الاصطناعي باستخدام نموذج Stable Diffusion الشهير وإصداراته المعدلة.
تُحقق LCM-LoRA ذلك من خلال تقليل "خطوات أخذ العينات" اللازمة التي يجب أن يمر بها نموذج الذكاء الاصطناعي لتحويل النص أو الصورة الأصلية إلى صورة ذات جودة أعلى. وهذا يعني أنها تسمح لنماذج Stable Diffusion بالعمل بشكل أسرع مع موارد حسابية أقل، مما ينتج عنه مخرجات جذابة في الوقت الحقيقي.
تُظهر الطبيعة "الشاملة" لـ LCM-LoRA أنها متوافقة مع تطبيقات مختلفة تعتمد على Stable Diffusion. بينما لا يزال يتوجب علينا معرفة ما إذا كان يمكن تكييفها مع نماذج ملكية مثل DALL-E 3 أو Midjourney.
لقد تواصلنا مع أحد مؤلفي ورقة LCM-LoRA للحصول على رؤى إضافية وسنقوم بتحديث هذه المقالة عند توفر المزيد من المعلومات.