أصدرت شركة Abacus AI، الناشئة التي تركز على تطوير منصة تعليم آلي مدفوعة بالذكاء الاصطناعي، نموذج لغة مفتوح المصدر غير رقابي يسمى Liberated-Qwen1.5-72B. تم تصميم هذا النموذج بشكل خاص للامتثال للمطالب النظامية، مما يعزز قابليته للاستخدام في التطبيقات العملية.
يعتمد Liberated-Qwen1.5-72B على نموذج Qwen1.5-72B المعتمد على التحويل، الذي أنشأه باحثون في مجموعة Alibaba. وتتيح له قدرته المحسّنة على اتباع المطالب النظامية أن يتميز عن النماذج الأخرى من LLMs المفتوحة المصدر، مما يجعله أكثر ملاءمة لمجموعة متنوعة من الاستخدامات، مثل الدردشة مع العملاء.
يصفBindu Reddy، الرئيس التنفيذي لشركة Abacus، النموذج بأنه الأكثر كفاءة في العالم بين نماذج LLMs غير الرقابية من حيث الأداء والامتثال للتعليمات النظامية.
أهمية الالتزام بالمطالب النظامية في نماذج LLMs
مع تزايد اعتماد الشركات على نماذج LLMs في مهام مثل دعم العملاء، فإن الحفاظ على السيطرة على تفاعلات الذكاء الاصطناعي أمر حيوي. تتضمن المحادثات عادةً عدة أدوار، وبدون قيود مناسبة، قد ينحرف الذكاء الاصطناعي عن دوره المقصود. على سبيل المثال، سبق لمستخدم أن ضلل روبوت الدردشة في قبول عرض بقيمة دولار واحد لشراء شاحنة Chevrolet Tahoe 2024، مما أدى إلى تأكيد الذكاء الاصطناعي للصفقة بشكل غير صحيح.
لمنع مثل هذه السيناريوهات غير المرغوب فيها، يعد الالتزام الصارم بالمطالب النظامية أمرًا بالغ الأهمية. ومع ذلك، فإن العديد من النماذج المفتوحة المصدر المتاحة في السوق تعاني من الحفاظ على هذا المستوى من الامتثال. تهدف شركة Abacus إلى تصحيح هذا الأمر مع Liberated-Qwen1.5-72B.
قامت الفرق التطويرية بتحسين النموذج باستخدام مجموعة بيانات مفتوحة المصدر جديدة تُسمى SystemChat، والتي تتكون من 7000 محادثة اصطناعية تم إنشاؤها باستخدام Mistral-Medium وDolphin-2.7-mixtral-8x7b. يمكّن هذا التدريب النموذج من اتباع الرسائل النظامية، حتى عند التناقض مع طلبات المستخدمين أثناء المحادثات.
وأشار ريدي على منصة X، "تحسين نموذجك باستخدام هذه المجموعة يجعل استخدامه أسهل بكثير وأكثر صعوبة في اختراقه!"
رؤى الأداء
وفقًا لاختبارات على معيار MT-Bench وHumanEval، تفوق Liberated-Qwen1.5-72B قليلًا على أفضل نموذج مفتوح المصدر السابق، Qwen1.5-72B chat، حيث سجل 8.45000 مقارنةً بـ 8.44375. وعلى معيار MMLU، الذي يقيم المعرفة العالمية وحل المشكلات، حصل النموذج على 77.13، وهو ما يقاربه نماذج عالية الأداء أخرى، بما في ذلك Qwen1.5-72B وSmaug-72B من Abacus.
من المهم الإشارة إلى أنه رغم فعالية Liberated-Qwen1.5-72B، إلا أنه يظل نموذجًا غير رقابي تمامًا، مما يعني أنه سيجيب عن جميع الأسئلة، بما في ذلك الموضوعات الحساسة، مع الالتزام بالرسائل النظامية. تنصح شركة Abacus المستخدمين بتنفيذ طبقات محاذاة خاصة بهم قبل نشر النموذج في أي سياق خدمي.
حاليًا، يتوفر Liberated-Qwen1.5-72B بموجب ترخيص tongyi-qianwen، الذي يعادل تقريبًا ترخيص MIT. وقد أعرب ريدي عن خطط لتعزيز النموذج بشكل أكبر، لا سيما فيما يتعلق بـ HumanEval، وتطوير نماذج أكثر تقدمًا من خلال دمج مجموعة بيانات SystemChat مع مجموعات بيانات من Smaug.
في الأسابيع المقبلة، تهدف شركة Abacus إلى تحسين درجات MT-bench، طامحةً لتحقيق المركز الأول على لوحة معلومات HumanEval.