أعلنت Alibaba Cloud اليوم عن ترقية لسلسلة نماذجها مفتوحة المصدر في مجال الذكاء الاصطناعي، المعروفة باسم Qwen، والتي تم re-designate كنموذج Qwen2. introduces This التحديث خمسة نماذج تم تدريبها مسبقًا وتعديلها وفق التعليمات بأحجام مختلفة، مما يعزز الأداء بشكل كبير عبر مجموعة متنوعة من القدرات، بما في ذلك الترميز والعمليات الرياضية، بالإضافة إلى دعم أطوال سياق أطول.
تتضمن سلسلة Qwen2 خمسة نماذج: Qwen2-0.5B، Qwen2-1.5B، Qwen2-7B، Qwen2-57B-A14B، وQwen2-72B. ومن الجدير بالذكر أن نموذج Qwen2-72B-Instruct قادر على التعامل مع أطوال سياق تصل إلى 128K توكن، مما يوفر للمستخدمين قدرة واسعة على معالجة النصوص.
فيما يتعلق ببيانات التدريب، اندمجت سلسلة Qwen2 مع بيانات عالية الجودة من 27 لغة إضافية إلى جانب الصينية والإنجليزية، مما يعزز قدراتها متعددة اللغات بشكل كبير. تستخدم جميع النماذج تقنية التدريب المعتمد على Quantization Aware Training (GQA) المعتمدة على التدرج، مما يعجل سرعة الاستنتاج ويقلل من استهلاك الذاكرة، مما يؤدي إلى تجربة مستخدم أكثر كفاءة واستقرارًا.
تشير نتائج التقييم إلى أن النماذج الكبيرة ضمن سلسلة Qwen2 قد أظهرت تحسينات ملحوظة. بشكل خاص، يتفوق نموذج Qwen2-72B على النماذج الرائدة مثل Llama-3-70B وQwen1.5-110B في فهم اللغة الطبيعية، ومعالجة المعرفة، والترميز، والرياضيات، والقدرات متعددة اللغات. يؤكد هذا الإنجاز على موقع سلسلة Qwen2 الريادي في تطوير نماذج الذكاء الاصطناعي.
كجزء من التزام Alibaba Cloud بالابتكار وتطوير الذكاء الاصطناعي، لا يقتصر إطلاق سلسلة Qwen2 على تقديم نماذج ذكاء اصطناعي متقدمة وفعالة، بل يبرز أيضًا براعة Alibaba Cloud التكنولوجية وقدرتها الابتكارية في قطاع الذكاء الاصطناعي. نحن نتطلع إلى الإطلاق المستقبلي لمزيد من النماذج والتقنيات الاستثنائية من Qwen لتعزيز التقدم في هذا المجال.