لقد شهدنا تغيرات ملحوظة في تكنولوجيا الصور التي يتم إنشاؤها بواسطة الذكاء الاصطناعي لفترة من الزمن، ولكن مؤخراً حققت الشركات الرائدة في هذا المجال تقدمًا كبيرًا. هذا الأسبوع، تصدرت التحديثات الملحوظة من Midjourney ونموذج Google الأخير وGrok اهتمام وسائل الإعلام.
كل من هذه الشركات تدفع حدود تكنولوجيا الذكاء الاصطناعي بوتيرات مختلفة وباتجاهات فريدة. مع استمرار المنافسة في هذا المجال، من المثير رؤية التقدم الذي تم إحرازه.
Midjourney تطلق محرر ويب جديد
قدمت Midjourney مؤخرًا محرر ويب جديد يجمع أدوات تعديل الصور المتنوعة في واجهة واحدة سهلة الاستخدام. سابقًا، كان يتعين على المستخدمين التنقل بين قوائم متعددة لإنجاز مهام مثل إعادة الإطار، وإعادة الرسم (تعديل الصور الحالية)، والتحريك، وتوسيع القماش، والتكبير. تعمل هذه الواجهة الجديدة على تحسين تجربة التحرير بشكل كبير، مما يمثل تحولًا من تشغيلها الأصلي على Discord.
وفقًا لمدير Midjourney التنفيذي ديفيد هولز، فإن الهدف هو جعل تعديل الصور المولّدة بالذكاء الاصطناعي “أسهل بكثير”. مع استمرار انتقال المنصة من Discord إلى تطبيق ويب، ستقوم Midjourney أيضًا بتزامن الأنشطة من قنوات شائعة مثل "الموضوع اليومي"، و"فن التوجيه"، و"العام-1" عبر كل من Discord وغرف الويب. بالإضافة إلى ذلك، تم استبدال أدوات التحديد التقليدية بأداة جديدة لاختيار الفرشاة الرقمية، مما يجعل عملية التحرير أكثر سلاسة للمستخدمين الذين أنشأوا أكثر من عشر صور على المنصة. كانت الملاحظات المبكرة من مجتمع المبدعين إيجابية للغاية. يأتي هذا التحديث بعد إصدار Midjourney 6.1، الذي حسّن بشكل ملحوظ جودة الصور، والتماسك (بما في ذلك دقة أفضل لتفاصيل اليد)، وسرعات المعالجة.
إطلاق Grok-2 المثيرة للجدل
بعد يومين فقط من تحديث Midjourney، تم الكشف عن Grok-2 من قبل شركة xAI التابعة لإيلون ماسك، مما يمثل تطورًا آخر في مجال توليد الصور بواسطة الذكاء الاصطناعي. يعتمد Grok-2 على نموذج Flux.1 من مختبر Black Forrest، ويحظى بشعبية متزايدة لجودة الصور المثيرة للإعجاب وسهولة الوصول إليه.
ومع ذلك، تثير إرشادات Grok-2 مخاوف. على عكس مولدات الذكاء الاصطناعي الأخرى، يبدو أن لديها سياسات قليلة جداً حول الملكية الفكرية، والعنف، والمحتوى الصريح. هذا النقص في الحدود الواضحة أثار جدلًا، حيث أنشأ المستخدمون صورًا مقلقة وغير تقليدية تذكر بأيام توليد الصورة المبكرة بالذكاء الاصطناعي. وصف ماسك Grok-2 بأنه “أكثر ذكاء اصطناعي مرح في العالم”، مما يشير إلى أن هذه المرونة قد تكون خيارًا مقصودًا يؤثر على مستقبل التكنولوجيا.
جوجل تطلق Imagen 3 للمنافسة
أخيرًا، كشفت Google عن نموذجها للذكاء الاصطناعي Imagen 3، متطلعة إلى كونه “أعلى نموذج لتوليد الصور من النصوص”. تم إصداره للمستخدمين في الولايات المتحدة، حيث يعد بتفاصيل محسّنة، وإضاءة أفضل، وأقل عدد من العيوب المشتتة مقارنةً بسابقيه. النموذج فعال للغاية في تقديم النصوص، ويأتي في نسخ متعددة لتلبية احتياجات متنوعة—from الرسومات السريعة إلى الصور عالية الدقة. حاليًا، يمكن الوصول إلى Imagen 3 من خلال مختبر Google لاختبار الذكاء الاصطناعي كجزء من ImageFX، على الرغم من أنه لا يزال في مرحلة تجريبية مغلقة، مما يتطلب من المستخدمين الانضمام إلى قائمة انتظار للمشاركة.