كشفت دراسة حديثة من معهد جورجيا للتكنولوجيا أن النماذج اللغوية الكبيرة (LLMs) تظهر تحيزًا ملحوظًا تجاه الكيانات والمفاهيم المرتبطة بالثقافة الغربية، حتى عند الطلب بلغة عربية أو تدريبها حصريًا على بيانات عربية. هذه الأبحاث، التي نُشرت على arXiv، تثير تساؤلات حيوية حول العدالة الثقافية وقابلية تطبيق أنظمة الذكاء الاصطناعي مع توسع استخدامها عالميًا.
في ورقتهم البحثية بعنوان "هل نشرب البيرة بعد الصلاة؟ قياس التحيز الثقافي في النماذج اللغوية الكبيرة"، يشير الباحثون إلى أنه "يتبين أن النماذج اللغوية متعددة اللغات ونماذج اللغة العربية الأحادية اللغات تظهر تحيزًا تجاه الكيانات المرتبطة بالثقافة الغربية". مما يبرز التحديات المستمرة التي تواجهها LLMs في فهم الفروق الثقافية والتكيف مع السياقات المحددة، على الرغم من التقدم الأخير في قدراتها متعددة اللغات.
المخاطر المحتملة للتحيز الثقافي في LLMs
تثير نتائج الدراسة القلق بشأن عواقب التحيزات الثقافية على المستخدمين من خلفيات غير غربية الذين يتعاملون مع التطبيقات المدعومة بـ LLM. وقد أشار آلان ريتر، أحد المؤلفين، إلى أن "تأثير النماذج اللغوية الكبيرة يتوقع أن يؤثر على العديد من التطبيقات في السنوات القادمة، مما يجعل توقع جميع الأضرار المحتملة نتيجة لهذا التحيز الثقافي أمرًا معقدًا". وأكد أن مخرجات LLM الحالية غالبًا ما تعزز الصور النمطية الثقافية، مثل ربط أسماء الذكور العرب بالفقر والتقليدية. على سبيل المثال، تُختار صفات مثل "فقير" و"متواضع" بشكل متكرر للشخصيات العربية الخيالية، بينما تُستخدم صفات مثل "ثري" و"فريد" بشكل شائع للأسماء الغربية. بالإضافة إلى ذلك، أظهرت LLMs ميلاً لإنتاج المزيد من النتائج السلبية الكاذبة في تحليل المشاعر للجمل التي تحتوي على كيانات عربية، مما يشير إلى ارتباط غير صحيح مع المشاعر السلبية.
سلط وي شيو، الباحث الرئيسي في الدراسة، الضوء على العواقب المحتملة، مشيرًا إلى أن هذه التحيزات لا تضر فقط بالمستخدمين من الثقافات غير الغربية، بل تعيق أيضًا دقة النموذج وتقوض ثقة المستخدمين في تكنولوجيا الذكاء الاصطناعي.
تقديم CAMeL: معيار لتقييم التحيزات الثقافية
لتقييم التحيزات الثقافية بفعالية، قدم فريق البحث CAMeL (مجموعة قياس ملاءمة الثقافة للنماذج اللغوية)، وهي مجموعة بيانات معيارية شاملة تتألف من أكثر من 20,000 كيان ثقافي ذي صلة من ثمانية فئات، بما في ذلك الأسماء الشخصية والطعام والملابس والمواقع الدينية. تتيح هذه المجموعة إجراء تحليل مقارن بين الثقافتين العربية والغربية.
قال الباحثون: "CAMeL تعمل كوسيلة لقياس التحيزات الثقافية في النماذج اللغوية من خلال تقييمات خارجية وداخلية". باستخدام CAMeL، قام الفريق بتقييم الأداء عبر الثقافات لـ 12 نموذجًا لغويًا، بما في ذلك GPT-4 الشهير، في مهام متنوعة مثل توليد القصص وتحليل المشاعر.
يتصور ريتر CAMeL كأداة لتحديد التحيزات الثقافية بسرعة داخل LLMs، مع تسليط الضوء على المجالات التي يجب على المطورين معالجتها. ومع ذلك، أشار إلى أن CAMeL يركز حاليًا على التحيزات الثقافية العربية ويخطط لتوسيع نطاقه ليشمل ثقافات إضافية في المستقبل.
الاتجاه القادم: بناء أنظمة ذكاء اصطناعي واعية ثقافيًا
لتخفيف التحيزات عبر الثقافات المختلفة، يوصي ريتر مطوري LLM بتجنيد مصنفين بيانات من خلفيات ثقافية متنوعة أثناء عملية الضبط، لتحسين توافق LLMs مع تفضيلات البشر بشكل فعال. وأوضح: "على الرغم من تعقيده وتكلفته، فإن هذه الخطوة ضرورية لضمان فوائد متكافئة من تقدم LLM".
حدد شيو مساهمًا كبيرًا في التحيز الثقافي: الاعتماد السائد على بيانات ويكبيديا في تدريب LLMs. وشرحت قائلة: "على الرغم من أن ويكبيديا تحتوي على معلومات من جميع أنحاء العالم، عادة ما تتلقى المفاهيم الغربية اهتمامًا أكبر في الترجمة إلى اللغات غير الغربية". واقترحت تحسينات في مزج البيانات أثناء التدريب المسبق وتوافق أفضل مع الحساسيات الثقافية البشرية.
يبرز ريتر تحديًا آخر يتمثل في تكيف LLMs مع الثقافات ذات التمثيل الضعيف عبر الإنترنت، حيث يمكن أن تعيق البيانات المحدودة دمج المعرفة الثقافية الأساسية. وي advocate approaches مبتكرة لتعزيز الكفاءة الثقافية لـ LLMs في هذه السيناريوهات، لضمان خدمتها بشكل فعال للمستخدمين.
تدعو هذه النتائج إلى التعاون بين الباحثين ومطوري الذكاء الاصطناعي وصانعي السياسات لمواجهة التحديات الثقافية التي تطرحها LLMs. وأكدت شيو: "نعتبر هذا فرصة للبحث في التكيف الثقافي لـ LLMs في كل من التدريب والنشر". هذه اللحظة أيضًا توفر فرصة للشركات للنظر في استراتيجيات التوطين لأسواق متنوعة.
من خلال إعطاء الأولوية للعدالة الثقافية وتطوير أنظمة ذكاء اصطناعي واعية ثقافيًا، يمكننا الاستفادة من هذه التكنولوجيا لتعزيز الفهم العالمي وتعزيز تجارب رقمية شاملة. كما أعربت شيو: "نحن متحمسون لقيادة الجهود في هذا الاتجاه ونتطلع إلى أن تُستخدم مجموعة بياناتنا، إلى جانب الأخرى التي تم تطويرها باستخدام أساليبنا المقترحة، بشكل روتيني لتقييم وتدريب LLMs لتحقيق مزيد من العدالة الثقافية".