أعلنت NVIDIA مؤخرًا عن إطلاق نموذج الذكاء الاصطناعي المحسن Llama-3.1-Nemotron-51B، القائم على بنية Llama-3.1-70B الخاصة بشركة Meta. يستخدم هذا النموذج التكنولوجي المتطور تقنية البحث عن العمارة العصبية (NAS) لتعزيز كفاءة الحوسبة بشكل كبير مع الحفاظ على دقة عالية، مما يتيح لمعالج H100 واحد القيام بمهام كبيرة عادة ما تتطلب موارد أجهزة أكبر.
يحافظ نموذج Llama-3.1-Nemotron-51B على القدرات القوية لسابقه Llama-3.1-70B، مع تقليل حجم المعلمات إلى 51 مليار. من خلال تحسين دقيق باستخدام تقنية NAS، لا يقوم هذا النموذج فقط بتقليل استهلاك الذاكرة وتعقيد الحوسبة، بل أيضًا يخفض بشكل كبير تكاليف التشغيل. وتفيد NVIDIA أن النموذج المحسن يحقق تحسينًا بمعدل 2.2 ضعف في سرعة الاستدلال مقارنة بالإصدار الأصلي 70B، مما يظهر كفاءة فائقة في استهلاك الطاقة.
في اختبارات الأداء المختلفة، برع Llama-3.1-Nemotron-51B في مهام مثل MT Bench وMMLU وتوليد النصوص والتلخيص، محتفظًا بدقة قريبة من الأصل بينما حسّن بشكل كبير سرعة المعالجة. يمكن للنموذج إدارة أحمال عمل أكبر على معالج H100 واحد، محققًا أداءً يزيد عن أربعة أضعاف.
تأتي هذه الإنجازات نتيجة لاستكشاف NVIDIA المكثف في تحسين الهياكل. قام الفريق بتطبيق تقنيات مثل التقطير الكتلي والتقطير المعرفي، حيث يتم تدريب نماذج "طلاب" أصغر لتكرار قدرات نماذج "معلمين" أكبر، مما يقلل بشكل كبير متطلبات الموارد مع الحفاظ على الدقة. بالإضافة إلى ذلك، تقوم خوارزمية Puzzle بتحسين الكتل المختلفة من خلال التسجيل والتكوين، محققة توازنًا مثاليًا بين السرعة والدقة.
تؤكد NVIDIA أن إدخال Llama-3.1-Nemotron-51B يمثل اختراقات جديدة في مجال الذكاء الاصطناعي، مما يوفر حلولًا أكثر كفاءة وتكلفة لتطبيقات العالم الحقيقي. مع استمرار تطور تكنولوجيا الذكاء الاصطناعي، تبقى تعزيز كفاءة الحوسبة مع الحفاظ على الدقة نقطة محورية في الصناعة. تقدم ابتكارات NVIDIA رؤى جديدة ووجهات نظر للتصدي لهذا التحدي.
تعتزم NVIDIA في المستقبل تعزيز جهود البحث والابتكار في تكنولوجيا الذكاء الاصطناعي، لدفع استخدامها وتطويرها عبر مجالات مختلفة. إن إطلاق نموذج Llama-3.1-Nemotron-51B يمثل خطوة مهمة إلى الأمام لـ NVIDIA في هذا المجال المتقدم بسرعة.