سرعة الابتكار في تدريب التعلم الآلي والذكاء الاصطناعي
تتطور advancements في مجال التعلم الآلي (ML) والذكاء الاصطناعي (AI) بسرعة، خاصةً مع ظهور مهام الذكاء الاصطناعي التوليدي الأكثر تعقيدًا. قام MLCommons بإطلاق معيار MLPerf 4.0 للتدريب، والذي يظهر مستويات أداء قياسية. يعد هذا المعيار الحيادي بين الشركات معترفًا به على نطاق واسع في الصناعة، حيث تساهم فيه 17 منظمة مع أكثر من 205 نتائج. يمثل هذا الإطلاق التحديث الأول لمعيار MLPerf منذ الإصدار 3.1 في نوفمبر 2023.
تتضمن معايير MLPerf 4.0 تطويرات كبيرة، بما في ذلك توليد الصور باستخدام Stable Diffusion وتدريب نموذج اللغة الكبير (LLM) لـ GPT-3. تشمل النتائج الجديدة لأول مرة معيار LoRA الذي يحسن من نموذج لغة Llama 2 70B لتلخيص الوثائق مع التركيز على كفاءة المعاملات.
عند مقارنة النتائج بالدورة السابقة، فإن المكاسب ملحوظة. قال ديفيد كانتر، مؤسس و مدير MLCommons، في مؤتمر صحفي: "بالنسبة لما كان عليه الأمر قبل ستة أشهر، أظهرت بعض المعايير تحسنًا في الأداء يصل إلى 2x، خصوصًا مع Stable Diffusion. هذا شيء مثير للإعجاب بعد نصف عام فقط."
تدريب Stable Diffusion أسرع بمعدل 1.8x مقارنةً بنوفمبر 2023، بينما يشهد تدريب GPT-3 زيادة في السرعة تصل إلى 1.2x.
أداء تدريب الذكاء الاصطناعي: ما وراء الأجهزة
بينما تلعب الأجهزة دورًا هامًا في تدريب نماذج الذكاء الاصطناعي، فإن البرمجيات والاتصال الشبكي داخل الكتل لها أهمية متساوية. أشار كانتر إلى أن "أداء تدريب الذكاء الاصطناعي يعتمد على عدة عوامل تزيد من الكفاءة، كما أن توزيع المهام والتواصل بين المعالجات أو المسرعات المتعددة أمر حيوي." تستفيد الشركات من السيليكون المتطور وكذلك الخوارزميات المتقدمة وزيادة القدرة، مما يعزز الأداء مع الزمن.
ريادة إنفيديا في التدريب مع معمارية هوبر
تعتبر إنفيديا رائدة في معايير MLPerf 4.0، حيث حققت سجلات أداء جديدة في خمسة من أصل تسعة أحمال اختبار. وقد تم تعيين هذه المعايير بشكل رئيسي باستخدام نفس منصات الأجهزة الأساسية المستخدمة في يونيو 2023.
وأكد ديفيد سلفاتور، مدير الذكاء الاصطناعي في إنفيديا، على القيمة المستمرة لمعماريات H100 Hopper. وقال: "على مدار تاريخ إنفيديا، نحقق عادة تحسينات في الأداء تتراوح بين 2x إلى 2.5x بفضل الابتكارات البرمجية أثناء دورة حياة المنتج."
استخدمت إنفيديا استراتيجيات متعددة لتعزيز الأداء في MLPerf 4.0، بما في ذلك تحسين كامل للبرمجيات، وتحسين دقيق لنموذج FP8، و FlashAttention الأمثل من cuDNN.
أهمية معايير تدريب MLPerf للمؤسسات
تقدم معايير MLPerf للمنظمات مقاييس موحدة حول أداء التدريب، لكن قيمتها تتجاوز الأرقام فحسب. وأبرز سلفاتور أن تحسينات الأداء تُحقق باستخدام الأجهزة الحالية، مما يثبت قدرة إنفيديا على الحصول على فوائد مستمرة من المعماريات الراسخة. بينما تخطط المؤسسات لنشر جديد، خاصةً على الأرض، فإن إمكانية التحسين المستمر بعد الاستثمار الأولي أمر حاسم.
وقال: "فيما يتعلق بأهمية الأداء، الجواب البسيط هو أنه يعزز العائد على الاستثمار للشركات."