ملاحظة لمصممي الجرافيك: أداة جديدة قد تغير قواعد اللعبة
نقدم لكم "COLE"، الأداة الرائدة المسماة تيمناً بهنري كول، رائد بطاقة عيد الميلاد الرسومية الأولى في عام 1843. تتيح هذه المنصة المبتكرة للمستخدمين إدخال أفكار التصاميم الجرافيكية، مثل "ملصق لحفل موسيقي في عطلة الشتاء مع موسيقيين يرتدون ملابس دافئة وسط تساقط الثلوج"، وتستخدم الذكاء الاصطناعي لإنشاء الصورة والنص المرافق.
ما هو "COLE"؟
"COLE" هو مزيج من نماذج الذكاء الاصطناعي المتطورة، بما في ذلك نسخ محسّنة من نموذج Llama2-13B من ميتا، وDeepFloyd IF، وLLaVA1.5-13B، وGPT-4V، مدعومة بمولد الرسوميات مفتوح المصدر Skia. تم تطويره من قبل فريق مكون من 12 باحثًا من Microsoft Research Asia وجامعة بكين، ويستجيب "COLE" لتعقيدات التصميم الجرافيكي ونقص بيانات التدريب على التنسيقات الرئيسية، خاصة ملفات .SVG. وقد قام الباحثون بتبسيط عناصر SVG إلى طبقة صورة موحدة، مما يسمح للذكاء الاصطناعي بوصف طبقات الخلفية من خلال النص.
تم تدريب نموذج خلفية "COLE" على مجموعة من 100,000 صورة تصميم جرافيكي عالية الجودة مأخوذة من الإنترنت.
أكثر من مجرد منتج
حاليًا، يعمل "COLE" أكثر كإطار عمل من كونه منتجًا تجاريًا. ومع ذلك، فإن إمكانياته مثيرة للإعجاب. من خلال إدخال عبارات بسيطة، يستطيع "COLE" إنشاء تصاميم جرافيكية واضحة ومنظمة تتكامل بسلاسة مع الصور والنصوص المنمقة. يمثل هذا تقدمًا كبيرًا، حيث كان من الصعب توليد نصوص وصور متكاملة للعديد من مولدات الفن بالذكاء الاصطناعي، بما في ذلك الرواد مثل Midjourney وDALL-E 3.
تصاميم يمكن تعديلها بواسطة الذكاء الاصطناعي
ربما تكون أبرز ميزات "COLE" هي قدرته على إنتاج صور تحتوي على نصوص وعناصر بصرية قابلة للتعديل. يمكن للمستخدمين تعديل النص مباشرة داخل الإطار دون الحاجة لتصديره إلى برامج مثل Adobe Photoshop أو InDesign. على سبيل المثال، يمكنهم بسهولة تغيير الخطوط أو تعديل الصور، وتحويل حقيبة التسوق من نمط فوتوراليستي إلى تمثيل كرتوني.
وفقًا للباحثين في ورقتهم الأخيرة على arXiv، "يجب أن يتطلب نظام توليد تصميم جرافيكي عالي الجودة وقابل للتوسع جهدًا ضئيلًا من المستخدمين، وإنتاج طباعة دقيقة، وتقديم خيارات تحرير مرنة." مع "COLE"، لقد حققوا هذا الهدف.
جودة تنافسية في التصميم الجرافيكي
يؤكد الباحثون أن "COLE" ينتج مخرجات بجودة "تنافسية جدًا"، حتى عند مقارنتها بـ DALL-E 3. لقد اختبروا "COLE" بدقة على 200 مشروع تصميم جرافيكي تتراوح بين الإعلانات والترويج للفعاليات، موثقين عباراتهم لتحقيق الشفافية.
يؤدي "COLE" أفضل عندما يتعلق الأمر بإنشاء أغلفة ورؤوس وملصقات، حيث يظهر قدرات تحرير تفوق على العناصر المحددة مقارنة بـ DALL-E 3 وأدوات مماثلة.
ومع ذلك، فإن "COLE" ليس حلاً كاملًا بعد. لا يمكن للمستخدمين تغيير ترتيب كتل النص، وتسمح الأداة حاليًا بلون واحد فقط من الطباعة لكل صورة. يخطط الباحثون لمعالجة هذه القيود في التطورات المستقبلية.
عصر جديد لمصممي الجرافيك؟
غالبًا ما يتم اعتبار التصميم الجرافيكي عالي الجودة أمرًا مسلمًا به، ولكنه شكل من أشكال الفن في حد ذاته. تعكس التصاميم—سواء كانت ملصقات حفلات موسيقية أو رسومات وظيفية مثل علامات الطريق—المهارة والإبداع.
هل يشكل "COLE" تهديدًا لمصممي الجرافيك؟ الجواب معقد. في حين أن حقول التحرير القابلة للتعديل في "COLE" تساعد المستخدمين على تحسين المخرجات والاستفادة من خبرات البشر، فإنه يبسط عملية تتطلب تقليديًا مهارة احترافية لتطوير عبارات فعالة. وهذا يجعل التصاميم الجيدة متاحة لأولئك الذين لا يملكون تدريباً رسمياً.
باختصار، يهدف "COLE" إلى ديمقراطية التصميم الجرافيكي عالي الجودة، وهو مفهوم تم استكشافه بالفعل من قبل شركات مثل Adobe وCanva. في هذا الصدد، قد يؤدي "COLE" إلى أن يصبح منافسًا ويعزز الأدوات القائمة في السوق.
حالياً، "COLE" غير متاح للجمهور، ولكن سيتم إصدار عرض توضيحي قريبًا على صفحة مشروعهم على GitHub.