أطلقت إنتل شريحة المعالجة الخاصة بالذكاء الاصطناعي من الجيل التالي، "Gaudi 3 AI Accelerator"، المصممة لتعزيز تطوير الذكاء الاصطناعي من خلال تبسيط سير العمل، وتسهيل البنية التحتية، وتسريع معاملات الشركات.
تحتفظ Gaudi 3 بمعمارية سابقتها، لكن مع أداء محسّن بشكل كبير - قوة حوسبة تفوق أربع مرات، وعرض نطاق شبكة مضاعف، و1.5 مرة من سعة الذاكرة عالية العرض (HBM)، مما يتيح لها التعامل مع الطلبات المتزايدة لنماذج اللغة الكبيرة (LLMs) دون التضحية بالأداء.
مستندة إلى تقنيات وحدات معالجة الرسوميات (GPU)، تجعل قدرات المعالجة المتوازية والعمارة متعددة البلاط في Gaudi 3 مناسبة جدًا كمسارع ذكاء اصطناعي. تأتي هذه الإطلاق كجزء من استراتيجية إنتل للتنافس مع Nvidia وAMD في سوق معالجات الذكاء الاصطناعي.
قدّم الرئيس التنفيذي لإنتل، باتريك جيلسنجر، لمحة عن Gaudi 3 خلال حدث "الذكاء الاصطناعي في كل مكان"، وأعلن أنه على الرغم من الإطلاق الرسمي اليوم، فإن التوافر العام سيكون في الربع الثالث من عام 2024، مع تلقي بعض العملاء عينات بالفعل.
وفقًا لجيني باروفيان، نائبة الرئيس لإنتل في حلول الذكاء الاصطناعي لمراكز البيانات، "يمثل الذكاء الاصطناعي التوليدي تحولًا أساسيًا في الحوسبة." وأكدت أن Gaudi 3 سيوفر الأداء والقابلية للتوسع والكفاءة المطلوبة لبناء أنظمة ذكاء اصطناعي مستقبلية.
مواصفات وأداء Intel Gaudi 3
يصف إيتان ميدينا، الرئيس التنفيذي للعمليات في مختبرات هابانا لدى إنتل، Gaudi 3 بأنه يتميز بعمارة حوسبة غير متجانسة تشمل 64 نواة معالجة Tensor (الجيل الخامس)، و8 محركات رياضية مصفوفية، وسعة 128 جيجابايت من HBM مع عرض نطاق 3.7 تيرابايت/ثانية، و24 منفذ 200 GbE RoCE Ethernet.
تم تصميم بناء الحلول باستخدام Gaudi 3 ليكون سهلًا كما هو الحال مع Gaudi 2. حيث ضاعفت إنتل عرض نطاق الشبكة لكل معالج، مما يتيح تكوينات عنقودية واسعة بناءً على احتياجات العمل، سواء كانت استنتاجًا أو ضبطًا دقيقًا أو تدريبًا.
مقارنة مع وحدات معالجة الرسوم Nvidia
عند مقارنة Gaudi 3 مع حزمة Nvidia H100 — الرائدة في تدريب نماذج اللغة الكبيرة مثل Llama 2 وGPT-3 — يُتوقع أن يكون Gaudi 3 أسرع بمعدل يصل إلى 1.7 مرة في مهام التدريب. في اختبارات الاستنتاج باستخدام نماذج مثل Llama-7B وFalcon 180B، يُفيد بأن Gaudi 3 يعمل بشكل أسرع بمعدل 1.5 مرة من H100 و1.3 مرة أسرع من H200 الأحدث. ومن الجدير بالذكر أن Gaudi 3 يظهر معدل كفاءة طاقة يزيد بمعدل يصل إلى 2.3 مرة عن H100 في مهام الاستنتاج.
خط إنتاج واسع
أطلقت إنتل شريحة Gaudi 3، بالإضافة إلى ثلاثة منتجات تكميلية:
1. بطاقة Gaudi 3 AI Accelerator (HL-325L): متوافقة مع OAM وسعة 1,835 TFLOPs و128 جيجابايت HBM2e.
2. اللوحة الأساسية العالمية (HLB-325): تقدم 14.6 PFLOPS وأكثر من 1 تيرابايت HBM2e.
3. بطاقة PCI Express: تتميز بتصميم تبريد سلبي بمديين، مع مقاييس أداء مقارنة بنظائرها.
مستقبل الذكاء الاصطناعي في الشركات
تتناول Gaudi 3 القضايا على مستوى المؤسسات، حيث صرح ساشين كاتي، نائب الرئيس الأول لمجموعة الشبكات والحافة، أننا ندخل عصر الوكلاء الذكاء الاصطناعي الذين يمكنهم التعامل بشكل مستقل مع مهام العمل المعقدة. ستشهد المرحلة القادمة من الذكاء الاصطناعي استخدام هؤلاء الوكلاء للبيانات الخاصة، مما يمهد الطريق لتحول كبير عبر الصناعات.
يبرز كاتي تحديات دمج البيانات غير المنظمة والخاصة في أنظمة الذكاء الاصطناعي، التي غالبًا ما تعتمد على وحدات المعالجة المركزية وتكون متناثرة عبر تنسيقات مختلفة. ويدعو إلى وجود نظام بيئي آمن وقابل للتعديل حيث يمكن للمؤسسات الاختيار من بين مجموعة من حلول الذكاء الاصطناعي المتوافقة، مع التركيز على النشر المسؤول لضمان موثوقية وتقليل التحيز.
تهدف إنتل إلى استغلال قدرات Gaudi المحسّنة لجذب العملاء بعيدًا عن نظام Nvidia، خاصة مع ارتفاع تكاليف الذكاء الاصطناعي. ومع توقعات بنمو كبير في سوق شرائح الذكاء الاصطناعي، تتخذ إنتل موقفًا كبديل قابل للتطبيق، م emphasizing an open and collaborative approach to AI solutions.
خاتمة
مع العلامات البارزة للذكاء الاصطناعي التوليدي في مجال الحوسبة، تقدم إنتل Gaudi 3 أداءً وكفاءة تنافسيين يهدفان إلى تحويل نشر الذكاء الاصطناعي في المؤسسات. تبرز التزام الشركة بالمعايير المفتوحة وتوافق الأنظمة تفانيها في دعم المشهد المتطور للذكاء الاصطناعي، واعدة بتلبية احتياجات المؤسسات المتنوعة التي تسعى للاستفادة من قوة الذكاء الاصطناعي.