هناك عدة طرق لضبط الذكاء الاصطناعي والتدريب والاستنتاج عند الحافة. واحدة من البدائل لوحدات المعالجة الرسومية التقليدية هي وحدة المعالجة العصبية (NPU) التي طورتها شركة Kneron.
في مؤتمر Computex في تايوان، كشفت Kneron عن تقنيتها الجديدة من السيليكون والخوادم التي تهدف إلى تعزيز استنتاج الذكاء الاصطناعي عند الحافة. تأسست Kneron في عام 2015، ويمتد قائمة مستثمريها لتشمل شركات بارزة مثل Qualcomm وSequoia Capital. في عام 2023، أطلقت الشركة وحدة KL730 NPU لمواجهة النقص العالمي في وحدات المعالجة الرسومية. ومع تقديم KL830 ومعاينة KL1140 المقرر إصدارها في 2025، تعمل Kneron أيضاً على توسيع عروض خوادم الذكاء الاصطناعي لديها مع خادم KNEO 330 Edge GPT، الذي يدعم قدرات الاستنتاج غير المتصل بالإنترنت.
تعتبر ابتكارات Kneron جزءاً من مجموعة متخصصة ولكنها متوسعة من الشركات، مثل Groq وSambaNova، التي تسعى إلى بدائل لوحدات المعالجة الرسومية لتحسين كفاءة استهلاك الطاقة في أعباء العمل الخاصة بالذكاء الاصطناعي.
الذكاء الاصطناعي عند الحافة ونماذج اللغة الخاصة المدعومة بـ NPU
هدف رئيسي في تحديث Kneron الأخير هو تسهيل إنشاء خوادم GPT خاصة قابلة للنشر في الموقع. هذا يلغي حاجة المؤسسات للاعتماد على أنظمة كبيرة مرتبطة بالسحابة، حيث يسمح نظام Kneron KNEO بالاستنتاج المحلي مباشرة عند حافة الشبكة.
شارك الرئيس التنفيذي ألبرت ليو أن نظام KNEO 330 يجمع بين عدة شرائح KL830 للذكاء الاصطناعي عند الحافة في خادم مدمج، مما يوفر نشرات GPT ميسورة التكلفة للمؤسسات. يتم استخدام النظام السابق KNEO 300، المدعوم بوحدة KL730، بالفعل من قبل مؤسسات كبرى مثل جامعة ستانفورد.
تم تصميم شريحة KL830، التي تقع بين KL730 السابقة وKL1140 المستقبلية، خصيصًا لنماذج اللغة. يمكن تسلسلها لدعم نماذج أكبر مع ضمان استهلاك منخفض للطاقة.
أدوات جديدة لتدريب وضبط الذكاء الاصطناعي عند الحافة
بالإضافة إلى الأجهزة، تركز Kneron على قدرات البرمجيات. وقد طورت الشركة أدوات متنوعة لتدريب وضبط النماذج المصممة لأجهزتها. أشار ليو إلى أن Kneron تجمع بين نماذج مفتوحة متعددة، وتقوم بضبطها لتحقيق الأداء الأمثل على وحدات NPU.
علاوة على ذلك، تقدم Kneron الآن مجمعًا عصبيًا يتيح للمستخدمين نقل النماذج المدربة باستخدام أطر عمل مثل TensorFlow أو Caffe أو MXNet مباشرة إلى شرائح Kneron. تدعم أجهزتها أيضًا سير عمل الجيل المعزز بالاسترجاع (RAG). وأبرز ليو أن شرائح Kneron تستخدم بنية فريدة تقلل من متطلبات الذاكرة لقواعد البيانات الكبيرة اللازمة لـ RAG، مما يمكّنها من العمل بكفاءة مع استهلاك طاقة أقل.
الميزة التنافسية لـ Kneron: استهلاك الطاقة المنخفض
تعتبر ميزة بارزة في تكنولوجيا Kneron هي استهلاك الطاقة المنخفض بشكل ملحوظ. قال ليو: "أعتقد أن الفرق الرئيسي هو أن استهلاك الطاقة لدينا منخفض جداً."
تصل أقصى قدرة استهلاك لوحدة KL830 الجديدة إلى 2 واط فقط، مع قدرة حسابية مركَّبة تصل إلى 10 eTOPS عند معالجة 8 بت. هذا الاستهلاك المنخفض للطاقة يتيح دمج شرائح Kneron في مجموعة متنوعة من الأجهزة، بما في ذلك أجهزة الكمبيوتر، دون الحاجة إلى حلول تبريد إضافية.