شهدت الأسبوع الماضي جدلاً حول روبوت الدردشة الذكي الجديد من جوجل، Gemini، الذي أنتج صوراً تاريخية غير دقيقة، مثل تصوير الآباء المؤسسين للولايات المتحدة كأفارقة، ومؤسسي جوجل كآسيويين. أعلنت الشركة أنها ستعلق مؤقتًا قدرة الذكاء الاصطناعي على توليد صور للأشخاص.
أكدت جوجل أنها تتعامل مع مخاوف المستخدمين وتخطط لإعادة تفعيل هذه الميزة في المستقبل.
كشفت لقطات الشاشة التي شاركها قادة التكنولوجيا والكتّاب ومستخدمو Gemini أن الذكاء الاصطناعي غالبًا ما يخلق صورًا لأشخاص من خلفيات متنوعة بغض النظر عن دقتها التاريخية. ومن الأمثلة على ذلك توليد باباوات كاثوليك من ذوي البشرة السوداء (على الرغم من عدم وجودهم فعليًا)، وتصوير الفايكنغ ببشرة داكنة (وهو ما لم يكن موجودًا في معظم الحالات)، وتجسيد جنود النازية الألمان كآسيويين (في حين أن معظمهم لم يكنوا كذلك).
بينما تهدف نماذج الذكاء الاصطناعي لتوليد الصور إلى القضاء على التحيز وتعزيز التنوع، أثارت النتائج الافتراضية لـ Gemini جدلاً حول نهج جوجل في التمثيل، مما أدى إلى سخرية واسعة النطاق وانتقادات.
ردًا على الانتقادات، أكد جاك كراوتشيك، مدير المنتج في جوجل، على وجود المشكلة، وأوضح أن الشركة تعمل على تحسين النموذج للاحترام التاريخي مع الحفاظ على الالتزام بالتنوع في المواضيع الأوسع، مثل تصوير شخص يسير مع كلب. وقال كراوتشيك: "كجزء من مبادئ الذكاء الاصطناعي لدينا، نحن نصمم قدرات توليد الصور لدينا لتعكس قاعدة مستخدمينا العالمية، ونأخذ التمثيل والتحيز على محمل الجد".
أثارت هذه الوضعية انتقادات كبيرة من المستخدمين والشخصيات المؤثرة، بما في ذلك المستثمرون مثل مارك أندريسن وبول غراهام، مما أدى إلى نقاش أوسع حول موثوقية روبوتات الدردشة الذكية مثل Gemini في تحقيق التوازن بين التنوع والدقة. لقد حظي هذا الجدل أيضًا باهتمام كبير من وسائل الإعلام، حيث ضج بها العناوين في صحيفة نيويورك بوست.
بينما تعمل جوجل على إيجاد حل، تجدر الإشارة إلى أن هذه ليست المرة الأولى التي يتعرض فيها Gemini للتدقيق. منذ إطلاق مجموعة نماذج Gemini في ديسمبر 2023، والتي تم ترويجها كشيء قابل للمقارنة وأحيانًا يتفوق على نموذج OpenAI GPT-4، واجهت جوجل تحديات مستمرة.
تلقى الإطلاق الأول ردود فعل سلبية بسبب فيديو تم إنتاجه بشكل مصطنع والذي مبالغ فيه في قدرات Gemini كمساعد رقمي. علاوة على ذلك، وجدت مراجعة من باحثين مستقلين أن Gemini كان أداؤه أدنى مقارنة بنموذج OpenAI الأقدم، GPT-3.5.
هذا الشهر، أعادت جوجل تسمية روبوت الدردشة Bard إلى Gemini وطرحت نسخًا متقدمة للمشتركين، كما تروّج أيضًا لنسخة محدثة من Duet AI تحت اسم Gemini لمستخدمي Workspace. على الرغم من وعدها بميزات محسنة مع Gemini 1.5 وAdvanced—لا سيما في تحليل الفيديو واستخراج المعلومات من الوثائق—قد يُخفي هذه القوة الجدل المستمر.
أكد كراوتشيك على أن الإبلاغ عن مشكلات مثل توليد الصور غير الدقيقة أمر ضروري للتحسين. ومع ذلك، إذا استمرت المشكلات في الظهور، فقد يقوض ذلك جهود جوجل في جعل Gemini رائدًا في فضاء الذكاء الاصطناعي التوليدي.