في ديسمبر 2023، كشفت جوجل عن "الكمبيوتر العملاق الذكي" (AI Hypercomputer)، وهو هيكل جديد رائد للكمبيوتر العملاق يجمع بين الأجهزة المحسّنة للأداء، والبرمجيات المفتوحة، وأطر التعلم الآلي الرائدة، ونماذج استهلاك مرنة. تهدف هذه المبادرة إلى تعزيز الكفاءة والإنتاجية في تدريب وتعديل وتقديم الذكاء الاصطناعي لعملاء جوجل السحابية، وتتنافس مع مايكروسوفت وأمازون على حصة السوق في قطاع الشركات.
يمكن لعملاء جوجل السحابية الوصول إلى هذا الكمبيوتر العملاق الذكي افتراضيًا، مما يتيح لهم تدريب نماذجهم وتطبيقاتهم الخاصة في الذكاء الاصطناعي. ومن الجدير بالذكر أن عملاء مثل Salesforce وLightricks قد استخدموا بنجاح TPU v5p من جوجل السحابية لتدريب نماذج ذكاء اصطناعي كبيرة.
خلال مؤتمر جوجل السحابي Next 2024، الذي يعقد سنويًا في لاس فيغاس، قدمت جوجل ترقيات هامة لأسطوانة الكمبيوتر العملاق الذكي، مشيدة بزيادة عدد العملاء البارزين الذين يستخدمون المنصة.
تحسينات الكمبيوتر العملاق الذكي من جوجل السحابية
تشمل الترقية الرئيسية الأولى توفر وحدة معالجة التنسور (TPU) v5p من جوجل السحابية، وهي أسرع وأقوى وحدة تسريع للذكاء الاصطناعي لديها. بالإضافة إلى ذلك، تعزز جوجل عائلتها من الآلات الافتراضية (VM) A3، من خلال طرح تكوينات A3 Mega المدعومة من وحدات معالجة الرسوم NVIDIA H100 Tensor Core، والتي ستطلق في مايو. ستستفيد الآلات الافتراضية A3 Mega من هذه الوحدات المتطورة، التي تحتوي كل منها على 80 مليار ترانزستور.
علاوة على ذلك، تخطط جوجل لدمج أحدث وحدات معالجة الرسوم Blackwell من Nvidia، مما يعزز الدعم لحوسبة الأداء العالي (HPC) وأحمال العمل المتعلقة بالذكاء الاصطناعي. ويتضمن ذلك الآلات الافتراضية التي تحتوي على وحدات معالجة الرسوم Nvidia HGX B200 وGB200 NVL72، المصممة خصيصًا لمهام الذكاء الاصطناعي وتحليل البيانات الصعبة. وستوفر وحدات GB200 NVL72 المتطورة والمبردة بالسوائل استنتاجات LLM في الوقت الحقيقي وتدريبًا على نطاق واسع لنماذج تحتوي على تريليوني ترانزستور.
بينما لا تزال نماذج الذكاء الاصطناعي التي تحتوي على تريليوني ترانزستور في مرحلة النشوء - مثل SambaNova وتحويل جوجل - يتسابق مصنعو الرقائق مثل Nvidia وCerebras لتطوير الأجهزة لهذه الأحجام المتزايدة من النماذج.
عملاء جوجل السحابية البارزين مثل Character.AI، شركة دردشة قيمتها السوقية تزيد عن مليار دولار، يحققون بالفعل فوائد من إعداد A3 الحالي. وقد أشار الرئيس التنفيذي Noam Shazeer إلى أن استخدامهم لـ TPUs وآلات A3 من جوجل السحابية يتيح تدريبًا واستنتاجًا أسرع وأكثر كفاءة لنماذج اللغة الكبيرة (LLMs). وأوضح أن هناك إمكانيات للأداء بكفاءة تكلفة تزيد عن ضعف الأداء من الجيل الجديد من المنصات.
تقديم JetStream لأداء الذكاء الاصطناعي المحسن
على صعيد البرمجيات، أطلقت جوجل السحابية JetStream، وهي محرك استنتاج مُحسّن للنماذج الكبيرة للغة. تقوم هذه الأداة بتحسين الأداء مقابل الدولار للنماذج المفتوحة وتدعم أطر مثل JAX وPyTorch/XLA، مما يعزز الكفاءة ويقلل التكاليف.
حلول تخزين مطورة لأحمال عمل الذكاء الاصطناعي
تحصل حلول التخزين من جوجل أيضًا على تحسينات. ستساعد ميزات التخزين المؤقت الجديدة في وضع البيانات بالقرب من مثيلات الحوسبة، مما يسرع عمليات التدريب للذكاء الاصطناعي، ويعزز كفاءة GPU وTPU، ويزيد من فعالية تكاليف الطاقة. ومن الجدير بالذكر أن Hyperdisk ML، وهي خدمة التخزين الكتلي الجديدة، تُحسن تدفقات العمل للاستنتاج والتقديم للذكاء الاصطناعي، مما يوفر أوقات تحميل للنماذج أسرع بمعدل يصل إلى 12 مرة.
تشمل التحديثات الإضافية Cloud Storage FUSE، الذي يزيد من إنتاجية التدريب بمعدل يبلغ 2.9 مرة، وParallelstore، الذي يسمح بالتخزين المؤقت الذي يعجل معدلات التدريب بما يصل إلى 3.9 مرة مقارنة بمحمّلات البيانات التقليدية. يسهل نظام Filestore الوصول المتزامن للبيانات عبر GPUs وTPUs، مما يحسن أوقات التدريب بمعدل يصل إلى 56%.
التعاون والترقيات البرمجية
أيضًا، تسعى جوجل إلى تعزيز التعاونات الجديدة وتقديم تطبيقات قابلة للتوسع لنماذج الانتشار واللغة المبنية على JAX. سيؤدي الدعم للشفرة المصدرية المفتوحة من PyTorch/XLA 2.3 إلى تحسين قابلية التوسع في التدريب الموزع من خلال ميزات مثل التقسيم التلقائي وتسجيل النقاط غير المتزامن.
وبالشراكة مع Hugging Face، يُمكن Optimum-TPU الخاص بجوجل السحابية العملاء من تحسين تدريب وتقديم نماذج الذكاء الاصطناعي على TPUs الخاصة بجوجل. بالإضافة إلى ذلك، ستوفر جوجل خدمات مايكرو انفراج NVIDIA NIM، مما يمنح المطورين خيارات مرنة لتدريب ونشر الذكاء الاصطناعي.
لتسهيل الاستخدام، تقدم جوجل السحابية جدولة عمل ديناميكية، مما يسمح للعملاء بحجز GPUs لفترات 14 يومًا، مما يضمن تحسين التكاليف لأحمال عمل الذكاء الاصطناعي.
تُظهر هذه التحديثات الفوائد العملية للأعمال الناتجة عن أبحاث جوجل وحلولها المبتكرة، مما يخلق بيئة متكاملة وفعالة وقابلة للتوسع لتدريب واستنتاج الذكاء الاصطناعي. وبالنسبة للأسعار الخاصة بعروض الكمبيوتر العملاق الذكي، تبقى التفاصيل غير معلنة. سيكون من الضروري مراقبة كيفية تنافس هذه المنصة ضد Microsoft Azure وAWS في تطوير الذكاء الاصطناعي في المؤسسات وما إذا كانت جوجل يمكنها الحفاظ على التزامها بتحسين ودعم الكمبيوتر العملاق الذكي بشكل موسع.