سامبا نوفا تسجل رقماً قياسياً جديداً في سرعة لاما 3 عند 1,000 رمز في الثانية

لا يوجد مؤشر سرعة واحد يقيس أداء نماذج الذكاء الاصطناعي التوليدي، ولكن أحد المؤشرات الرئيسية هو عدد الرموز المعالجة في الثانية. اليوم، أعلنت SambaNova Systems عن إنجاز كبير في أداء الذكاء الاصطناعي التوليدي، حيث وصلت إلى 1,000 رمز في الثانية مع نموذج التعليم Llama 3 ذو 8 مليارات من المعاملات. كان الرقم القياسي السابق لنموذج Llama 3 بحوزة Groq عند 800 رمز في الثانية. وقد تم التحقق من هذا الإنجاز الجديد بشكل مستقل من قبل شركة الاختبار Artificial Analysis. تتيح زيادة سرعة المعالجة تأثيرات هامة على الشركات، مما يمكن أن يؤدي إلى تقليل أوقات الاستجابة، وتعزيز استخدام الأجهزة، وخفض تكاليف التشغيل.

سباق أداء الذكاء الاصطناعي

قال جورج كاميرون، المؤسس المشارك لشركة Artificial Analysis: "نشهد تسارعًا في سباق شرائح الذكاء الاصطناعي يفوق التوقعات. نحن متحمسون للتحقق من ادعاءات SambaNova من خلال مقاييس مستقلة تركز على الأداء في العالم الحقيقي." وأضاف: "يتمتع مطورو الذكاء الاصطناعي الآن بمجموعة واسعة من الخيارات للأجهزة، وهو ما يكون مفيدًا بشكل خاص للتطبيقات المعتمدة على السرعة مثل وكلاء الذكاء الاصطناعي وحلول الذكاء الاصطناعي الموجهة للمستهلك التي تتطلب أوقات استجابة قصيرة للغاية ومعالجة فعالة للمستندات."

كيف تسرع SambaNova من تطوير Llama 3 والذكاء الاصطناعي التوليدي

تكرّس شركة SambaNova جهودها لتطوير حلول الذكاء الاصطناعي التوليدي الموجهة للشركات، مع الجمع بين القدرات المادية والبرمجية.

في الجانب المادي، صممت الشركة شريحة ذكاء اصطناعي فريدة تعرف بوحدة بيانات قابلة لإعادة التهيئة (RDU). تشبه هذه الوحدات معززات الذكاء الاصطناعي من Nvidia، حيث تتفوق في التدريب والاستدلال وتعمل على تعزيز عبء عمل المؤسسات وتعديل النماذج. تم الكشف عن النموذج الأخير، SN40L، في سبتمبر 2023.

تقدم SambaNova أيضًا مجموعة برمجية ملكية تتضمن نموذج Samba-1، الذي أُطلق في 28 فبراير. يتكون هذا النموذج من تريليوني معامل، ويُعرف باسم Samba-CoE (مجموعة الخبراء)، مما يمكّن الشركات من استخدام نماذج متعددة بشكل منفصل أو مجتمعة، حسب احتياجات بياناتهم.

لتحقيق سرعة 1,000 رمز في الثانية، استخدمت SambaNova نموذج Samba-1 Turbo، وهو نسخة API متاحة للاختبار. تخطط الشركة لتضمين هذه التحسينات في نموذجها الرئيسي الموجه للمؤسسات قريبًا. ومع ذلك، أشار كاميرون إلى أن قياس Groq البالغ 800 رمز في الثانية يشير إلى نقطة نهاية API العامة، بينما تأتي نتائج SambaNova من نقطة نهاية خاصة مخصصة، مما يجعل المقارنات المباشرة أقل وضوحًا.

وفي هذا السياق، قال كاميرون: "ومع ذلك، فإن هذه السرعة تتجاوز بمقدار 8 مرات المتوسط الناتج لمقدمي API الآخرين الذين قمنا باختبارهم، وهي أسرع عدة مرات من المعدلات النموذجية على أجهزة Nvidia H100."

تدفق بيانات قابل لإعادة التهيئة لأداء محسّن

يعتمد أداء SambaNova على معمارية تدفق البيانات القابلة لإعادة التهيئة، وهي جوهر تقنية RDU. تتيح هذه المعمارية تحسين تخصيص الموارد عبر طبقات الشبكات العصبية والنوى من خلال تخطيط المترجم.

قال رودريغو ليانغ، الرئيس التنفيذي ومؤسس الشركة: "من خلال تدفق البيانات، يمكننا تحسين تخطيط النماذج باستمرار لأن النظام قابل للتعديل بالكامل. وهذا يؤدي إلى تحسينات كبيرة في الكفاءة والأداء مع تطور البرمجيات."

عند إصدار Llama 3، حقق فريق ليانغ أداءً يقدر بـ 330 رمز في الثانية على Samba-1. ومن خلال تحسينات مكثفة على مدار الأشهر الماضية، تضاعفت هذه السرعة الآن لتصل إلى 1,000 رمز في الثانية. أوضح ليانغ أن التحسين يشمل موازنة توزيع الموارد بين النوى لمنع الاختناقات وزيادة إجمالي الإنتاجية داخلpipeline الشبكة العصبية، وهو ما يطابق الأسلوب المتبع في مجموعة برمجيات SambaNova لدعم الشركات في جهود التعديل الخاصة بهم.

جودة مؤسسية وسرعة أعلى

أكد ليانغ أن SambaNova تحقق هذا الإنجاز بسرعة باستخدام دقة 16 بت، وهي معيار يضمن الجودة التي تحتاجها الشركات.

قال: "لقد استخدمنا باستمرار دقة 16 بت لعملائنا، حيث إنهم يفضلون الجودة وتقليل حالات الهلوسة في النتائج."

تتزايد أهمية السرعة لمستخدمي المؤسسات بشكل متزايد مع اعتماد المنظمات على workflows المدعومة بالذكاء الاصطناعي. علاوة على ذلك، فإن أوقات التوليد الأسرع توفر مزايا اقتصادية.

وأضاف: "كلما أسرعنا في توليد الاستجابات، زادت الموارد المتاحة للآخرين للاستخدام. في نهاية المطاف، يؤدي ذلك إلى بنية تحتية أكثر كثافة وتوفير في التكاليف."

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles