نجحت شركة Etched في جمع 120 مليون دولار لتحدي Nvidia في سوق شرائح الذكاء الاصطناعي. تُطور الشركة شريحة جديدة تُسمى Sohu، صُممت لمعالجة جانب حاسم في معالجة الذكاء الاصطناعي: هيكل المحولات. من خلال دمج هذا الهيكل مباشرةً في شريحتها، تدعي Etched أنها تُنتج أقوى الخوادم لعمليات استدلال المحولات، وتعتبر Sohu أسرع شريحة محولات تم صنعها على الإطلاق.
هذا الإعلان جدير بالاهتمام بشكل خاص، حيث تجاوزت Nvidia مؤخرًا Microsoft لتصبح الشركة الأكثر قيمة في العالم، مع وصول تقييمها إلى 3.3 تريليون دولار. تثق Etched، المدعومة بمستثمرين مؤثرين مثل Peter Thiel، في قدرة فريقها المكون من 35 عضوًا على المنافسة مع Nvidia. جذبت جولة التمويل، التي قادتها Primary Venture Partners وPositive Sum Ventures، مستثمرين مؤسسيين مثل Hummingbird وFundomo وFontinalis وLightscape وEarthshot وTwo Sigma Ventures وSkybox Data Centers.
يُعتبر بعض المستثمرين الملائكة البارزين مثل Peter Thiel وStanley Druckenmiller وDavid Siegel وBalaji Srinivasan وAmjad Masad وKyle Vogt وKevin Hartz وJason Warner وThomas Dohmke وBryan Johnson وMike Novogratz وImmad Akhund وJawed Karim وCharlie Cheeve. علق أليكس هاندي، مدير منحة Thiel، قائلاً: "الاستثمار في Etched يُمثل رهانًا استراتيجيًا على مستقبل الذكاء الاصطناعي. تُعالج شرائحهم قضايا التوسع التي يخشى المنافسون التعامل معها، مما يساعد في مكافحة الركود الذي نراه في أماكن أخرى من الصناعة. يُجسد المؤسسون الموهبة غير التقليدية التي ندعمها، حيث تركوا هارفارد لمواجهة تحدي أشباه الموصلات. إنهم يُمهدون الطريق لابتكارات وادي السيليكون دون عبء القلق بشأن التكنولوجيا القديمة."
يزداد الطلب على وحدات معالجة الرسوميات القوية.
تأسست Etched على يد المطرودين من هارفارد، روبرت واشتين، غافين أوبرتي، وكريس زو، الذين قدموا التزامًا كبيرًا تجاه الذكاء الاصطناعي منذ يونيو 2022 من خلال الرهان على الإمكانات التحويلية لنموذج المحولات. تاريخيًا، لعبت نماذج الذكاء الاصطناعي المختلفة مثل CNNs وRNNs وU-Nets أدوارًا قوية في مجالاتها، ولكن المحولات (الحرف "T" في ChatGPT) ظهرت كنموذج الذكاء الاصطناعي القابل للتوسع الأول.
قال الرئيس التنفيذي غافين أوبرتي في منشور بالمدونة: "نعتقد أن الذكاء سيستمر في التوسع مع الحوسبة. رهاننا هو أن الشركات ستستثمر مليارات الدولارات في نماذج الذكاء الاصطناعي التي تعمل على شرائح متخصصة." وأوضح: "على مدار العامين الماضيين، طورنا Sohu، أول شريحة ASIC متخصصة للمتحولات في العالم. لا يمكن لهذه الشريحة تشغيل نماذج الذكاء الاصطناعي التقليدية، مثل DLRMs التي تُحسن من تدفقات إنستغرام أو نماذج طي البروتين، كما لا يمكنها التعامل مع CNNs أو RNNs. ومع ذلك، بالنسبة للمتحولات، لا يُضاهى Sohu في السرعة والاقتصادية، حيث يتفوق على وحدات معالجة الرسوميات Blackwell القادمة من Nvidia بشكل ملحوظ."
أكد أوبرتي أن المشهد الخاص بنماذج الذكاء الاصطناعي قد اننقل بشكل كبير نحو المحولات، كما يتضح من التطورات مثل ChatGPT وSora وGemini وStable Diffusion 3. إذا ظهرت هياكل جديدة، مثل SSMs أو خلطات Monarch، قد تفقد شرائح Etched أهميتها. ومع ذلك، إذا كانت توقعاتهم صحيحة، قد تُحدث Sohu تحولًا كاملًا في اللعبة. تتعاون الشركة مع TSMC للتصنيع على عقدة 4 نانومتر المتقدمة.
لماذا هذا الرهان؟
تركيز Etched على المحولات.
تعتبر Etched أن المفتاح لتحقيق الذكاء الفائق يكمن في التوسع. في خمس سنوات فقط، تطورت نماذج الذكاء الاصطناعي من أشكال بدائية إلى التفوق على القدرات البشرية في الاختبارات القياسية، مدفوعة بشكل أساسي بزيادة النطاق.
من خلال توسيع نماذج الذكاء الاصطناعي وتعزيز جودة بيانات التدريب، تصبح هذه الأنظمة أذكى بكثير. فقد زادت كمية FLOPS المطلوبة لتدريب النماذج الرائدة بنسبة مذهلة تقدر بـ 50,000 مرة من GPT-2 إلى Llama-3-400B في خمس سنوات.
أوضح أوبرتي أنه بينما كانت الهياكل المستخدمة في الذكاء الاصطناعي تتطور سريعًا في السابق، مع ظهور عدد كبير من النماذج، فإن الأنظمة الحالية المتطورة، مثل Llama 3، تشبه إلى حد كبير أسلافها مثل GPT-2، مع تعديلات طفيفة فقط. من المحتمل أن تستمر هذه الاتجاهات.
وأشار أوبرتي إلى أن "جميع اللاعبين الرئيسيين، بما في ذلك Google وOpenAI وAmazon وMicrosoft، يستثمرون أكثر من 100 مليار دولار في مراكز البيانات الخاصة بالذكاء الاصطناعي." على الرغم من الآراء المتباينة في الأوساط الأكاديمية، فإن المختبرات الرائدة في الذكاء الاصطناعي تتفق إلى حد كبير على أن توسيع النماذج اللغوية الكبيرة سيقودنا نحو الذكاء الفائق.
أكد أوبرتي "نحن نشهد أكبر توسع في البنية التحتية في التاريخ. لقد أظهرت قوانين التوسع نجاحًا متسقًا على مدى العشرة أوامر الماضية (من $10^{16} إلى $10^{26} FLOPS). إذا ظلت التوقعات صحيحة للأربعة أوامر القادمة (حتى $10^{30} FLOPS)، فإن الذكاء الفائق سيكون في متناول اليد، وستهيمن شرائح الذكاء الاصطناعي على الطلب في السوق."
تحجرت الشرائح المرنة.
وجهة نظر Etched حول وحدات معالجة الرسوميات.
في السنوات الأخيرة، هيمنت التغييرات المتكررة في هياكل النماذج، مثل CNNs وDLRMs وLSTMs، على مشهد الذكاء الاصطناعي، حيث تكبد كل منها تكاليف كبيرة. تراوحت السوق الشاملة لشرائح الذكاء الاصطناعي من 10 مليارات إلى 20 مليار دولار.
لتلبية هذا السوق الواسع، طورت العديد من الشركات شرائح AI متعددة الاستخدامات لمجموعة متنوعة من الهياكل، بما في ذلك وحدات معالجة الرسوميات من Nvidia وTPUs من Google وTrainium من Amazon وغيرها. ومع ذلك، واجهت جميعها صعوبات في مطابقة أداء H100 من Nvidia.
نوه أوبرتي إلى أن "العديد من المنافسين يدعون تحقيق مكاسب في الأداء من خلال دمج عدة شرائح في بطاقة واحدة، في حين أن الأداء لكل مساحة لا يزال راكدًا - وما زالت التحديات قائمة لأي شخص يسعى للانتقال من وحدات معالجة الرسوميات."
تؤكد Etched أن كل سوق حوسبة كبيرة يميل في النهاية نحو الشرائح المتخصصة، من الشبكات إلى تعدين البيتكوين، حيث توفر مزايا أداء هائلة مقارنة بوحدات معالجة الرسوميات. قال أوبرتي: "نظرًا للمخاطر المالية الهائلة في الذكاء الاصطناعي، فإن التخصص أمر لا مفر منه."
تتوقع Etched أن يركز الجزء الأكبر من الاستثمارات على النماذج التي تتجاوز 10 تريليون معلمة، والتي من المرجح أن تعمل من خلال عدد قليل من مراكز البيانات السحابية الكبيرة، مما يعكس الاتجاهات التي تم رؤيتها في تصنيع الشرائح حيث حلت المرافق عالية التكلفة والدقة العالية محل أصغر منها.
وأضاف: "حتى إذا تم تطوير هيكل أفضل، فإن الانتقال بعيدًا عن المحولات ينطوي على تحديات كبيرة، حيث يجب إعادة العمل الأساسي عبر مختلف الجوانب التقنية." مع زيادة تعقيد نماذج الذكاء الاصطناعي وارتفاع تكاليف التدريب، ستزداد الطلب على الشرائح المتخصصة، مما يجعل المتبنين الأوائل قادة في هذا المجال.
تتموضع Etched لتكون رائدة.
يؤكد المؤسسون - واشتين وأوبرتي وزو - أنه لم يتم بناء أي شرائح AI متخصصة في هيكل معين حتى الآن. في السابق، كان يتطلب إنشاء مثل هذه الشرائح المتخصصة طلبًا كبيرًا وقناعة بشأن استدامتها على المدى الطويل.
قال أوبرتي: "لقد اخترنا الاستثمار في المحولات، وهي تكتسب زخمًا بسرعة."
مع تزايد الطلب على عمليات استدلال المحولات الآن لتجاوز 5 مليارات دولار، أدمجت الشركات التقنية الكبرى، بما في ذلك OpenAI وGoogle وAmazon وMicrosoft، نماذج المحولات في عملياتها.
سلط أوبرتي الضوء على أن الهياكل المختلفة قد توحدت بشكل كبير. النماذج مثل سلسلة GPT من OpenAI وPaLM من Google وLLaMa من Facebook تتركز بشكل كبير حول المحولات.
وأكد: "نحن نتقدم بسرعة لتحقيق إمكانات Sohu." مضيفاً: "نحن في سبيلنا لتحقيق أسرع دورة تطوير لشريحة 4 نانومتر تم التحقق منها. وبالتعاون مع TSMC، نقوم بتأمين HBM3E من موردين ذوي مستوى عالٍ، مع ضمانات تصل إلى عشرات الملايين من الشركات في الذكاء الاصطناعي."
أكدت الشركة أيضًا أن نماذج الذكاء الاصطناعي اليوم غالبًا ما تكون باهظة الثمن وبطيئة في تقديم المنتجات بشكل فعال، مع تحديات مثل ارتفاع التكاليف التشغيلية لوكلاء ترميز الذكاء الاصطناعي وأوقات معالجة بطيئة لنماذج الفيديو.
اختتم أوبرتي قائلاً: "مع Sohu، يمكننا تغيير المشهد. أصبحت القدرات في الفيديو والصوت والبحث في الوقت الحقيقي قريبة المنال، مما يُحسن بشكل جذري الجدوى الاقتصادية لمنتجات الذكاء الاصطناعي."
هل يمكن أن تتفوق Etched على Nvidia؟
تضع نهج Etched الفريد في المعالجة المتوازية الشركة في موقع متميز في السوق.
ردًا على الأسئلة حول كيفية تمكن شركة أصغر من تجاوز Nvidia، أوضح COO روبرت واشتين، "تاريخيًا، كان سوق حوسبة الذكاء الاصطناعي متفككًا، مع استخدام العديد من النماذج بشكل نشط. تم إنفاق مليارات الدولارات على نماذج المحولات، مما يشير إلى تحول نحو التخصص. على الرغم من أن شرائحنا لن تتفوق على وحدات معالجة الرسوميات في أعباء العمل العامة، إلا أنها ستسيطر على استدلال المحولات، وهو أمر أساسي لمنتجات الذكاء الاصطناعي الإبداعية."
يمنح هذا التخصص Etched ميزة تنافسية، مما يسمح لشرائحها بالتفوق في الأماكن التي تعجز فيها الشرائح الأخرى.