أبحاث Databricks تؤكد أن Intel Gaudi يتفوق على Nvidia من حيث الأداء مقابل السعر في مجال مسرعات الذكاء الاصطناعي.

تتسابق إنتل مع Nvidia في عالم مسرعات الذكاء الاصطناعي، حيث تبرز تقنيتها Gaudi 2 وفقاً لأبحاث جديدة أجرتها Databricks. تكشف الأبحاث أن Gaudi 2 تنافس بقوة مسرعات Nvidia الرائدة. بالنسبة لاستدلال نماذج اللغة الكبيرة (LLM)، تساوي Gaudi 2 زمن الاستجابة لنظم Nvidia H100 في فك التشفير، وتتفوق على أداء Nvidia A100. علاوة على ذلك، تحقق Gaudi 2 استخداماً أفضل لعرض النطاق الترددي للذاكرة مقارنةً بكل من H100 و A100.

رغم أن مسرعات Nvidia العليا لا تزال تقدم أداء تدريب متفوق، وجدت Databricks أن Gaudi 2 توفر ثاني أسرع أداء تدريب لنموذج LLM على مستوى عقدة واحدة بعد H100، حيث توفر أكثر من 260 TFLOPS لكل شريحة. ومن الجدير بالذكر أنه بناءً على تسعير السحابة العامة، تقدم Gaudi 2 أفضل نسبة تكلفة إلى أداء لكل من التدريب والاستدلال مقارنةً بـ A100 و H100.

تشارك إنتل أيضاً نتائج اختبارات Gaudi 2 عبر معيار MLcommons MLPerf للتدريب والاستدلال، مما يعزز أداء التقنية من خلال بيانات من طرف ثالث. وقال أبيناف فينغالا، كبير معماريي معالجة اللغة الطبيعية في Databricks: "انبهجنا بكفاءة Gaudi 2، خصوصاً في استدلال LLM". أشار إلى أن الفريق لم يتمكن من استكشاف الفوائد المتعلقة بأداء Gaudi 2 لدعم FP8 في أحدث إصدار للبرمجيات.

تتوافق رؤى إنتل مع النتائج التي توصلت إليها Databricks. وقال إيتان ميدينا، الرئيس التنفيذي للعمليات في Habana Labs (شركة تابعة لإنتل)، إن التقرير يدعم مقاييس الأداء الداخلية لإنتل وآراء العملاء. وأكد: "تحقق ادعاءاتنا أمر ضروري، خاصة وأن الكثيرين يعتبرون Gaudi بمثابة السر الأفضل الذي تحتفظ به إنتل"، مشدداً على أهمية مثل هذه المنشورات لزيادة الظهور.

منذ استحواذ إنتل على Habana Labs وتكنولوجيا Gaudi في عام 2019 مقابل ملياري دولار، عززت إنتل قدراتها بشكل مستمر. تشارك كل من إنتل وNvidia بنشاط في معايير MLcommons MLPerf، التي تُحدث بانتظام. أبرزت أحدث معايير MLPerf 3.1، التي تم إصدارها في نوفمبر، سجلات جديدة في سرعة تدريب نماذج LLM لكلتا الشركتين، مدعومة بأداء تنافسي في معايير الاستدلال لشهر سبتمبر.

بينما تعد المعايير مثل MLPerf مثيرة للاهتمام، أشار ميدينا إلى أن العديد من العملاء يعطون الأولوية لاختباراتهم لضمان التوافق مع نماذج وحالات استخدام محددة. قال: "نضوج مجموعة البرمجيات أمر حاسم، حيث يكون العملاء أحيانًا متشككين في المعايير التي يقوم فيها البائعون بتحسين كبير لمقاييس معينة". ويرى نتائج MLPerf كفلتر ابتدائي قيم قبل أن تستثمر الشركات مزيداً من الوقت في الاختبار.

بالنظر إلى المستقبل، تستعد إنتل لإطلاق مسرع الذكاء الاصطناعي Gaudi 3 في عام 2024. يعد Gaudi 3، المبني على عملية بحجم 5 نانومتر، بتقديم أربعة أضعاف القدرة على المعالجة ومرتين من عرض النطاق الترددي مقارنةً بـ Gaudi 2. وأكد ميدينا: "يمثل Gaudi 3 قفزة كبيرة في الأداء، مما يعزز الأداء لكل دولار ولكل وات".

علاوة على ذلك، تخطط إنتل لتطوير أجيال مستقبلية ستدمج تقنيات الحوسبة عالية الأداء (HPC) ومسرعات الذكاء الاصطناعي. تدرك الشركة أيضاً أهمية تقنيات وحدات المعالجة المركزية (CPU) لاستدلالات الذكاء الاصطناعي، حيث أعلنت مؤخراً عن معالجات Xeon من الجيل الخامس مع تسريع الذكاء الاصطناعي. اختتم ميدينا بالقول: "لا تزال وحدات المعالجة المركزية تلعب دوراً حاسماً في مهام الاستدلال والتحسين، وخاصة عندما يتم دمجها مع مسرعات Gaudi لتلبية أعباء التشغيل الكثيفة في الذكاء الاصطناعي"، مشدداً على ضرورة وجود مجموعة متنوعة من الحلول.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles