كشفت شركة SambaNova Systems عن نموذج لغوي كبير قد يكون من الأكبر حتى الآن: Samba-1 الذي يحتوي على تريليون معلمة. على عكس GPT-4 من OpenAI، لا يعد Samba-1 نموذجًا واحدًا فحسب، بل يجمع أكثر من 50 نموذج ذكاء صناعي عالي الجودة من خلال بنية تُعرف باسم "تكوين الخبراء"، مما يتيح تخصيصه وتحسينه لتطبيقات المؤسسة المحددة.
في سبتمبر، أعلنت SambaNova عن شريحة الذكاء الاصطناعي SN40L، المصممة للتنافس مع Nvidia من خلال توفير حل فعال للتدريب والاستدلال. سيتم دمج نموذج Samba-1 في مجموعة SambaNova، مما يمكّن المؤسسات من تخصيص ونشر النماذج بفعالية.
وأكد رودريغو ليانغ، المؤسس المشارك والرئيس التنفيذي لشركة SambaNova، على قيمة توفير نماذج مركبة مسبقًا ومدربة ومُحسَّنة. تتيح هذه الميزة للشركات تحقيق نشرات عالية الأداء دون الحاجة إلى التعديلات الكبيرة التي تتطلبها النماذج بشكل تقليدي.
كيفية استخدام Samba-1 لبنية تكوين الخبراء لبناء نموذج لغوي ضخم
يتكون Samba-1 من أكثر من 50 نموذج ذكاء اصطناعي مدرب بشكل فردي ومحسّن للتماسك. يشمل ذلك نماذج خاصة بشركة SambaNova ونماذج مفتوحة المصدر مختارة تناسب مهام معينة، مثل Llama 2، وMistral، وDeepSeek Coder، وFalcon، وDePlot، وCLIP، وLlava.
قال ليانغ: “لقد أخذنا أفضل النماذج، وحسّناها، وجمعناها في نموذج واحد بتريليون معلمة.” يمكن للنماذج داخل Samba-1 التفاعل بسلاسة، مما يسمح بأن تكون استجابة واحدة مدخلات لنماذج أخرى.
رغم أن ربط نماذج اللغة الكبيرة لا يعد جديدًا، كما تفعل تقنيات مفتوحة المصدر شعبية مثل LangChain، إلا أن ليانغ يؤكد أن نهج تكوين الخبراء في Samba-1 يوفر مزايا كبيرة. على عكس LangChain، التي تتطلب من المستخدمين تعريف سلاسل النماذج مسبقًا، يمكن ربط خبراء Samba-1 ديناميكيًا بناءً على التحفيزات والاستجابات، مما يعزز المرونة.
علاوة على ذلك، يسمح Samba-1 للمستخدمين بالحصول على وجهات نظر متنوعة من خلال الاستفادة من نماذج مدربة على مجموعات بيانات مختلفة. وأوضح قائلاً: "يمكنه إنشاء 50 نموذجًا يعادل LangChain لاستكشاف نتائج متنوعة".
تكوين الخبراء مقابل مزيج الخبراء
من المهم التمييز بين تكوين الخبراء ومنهج مزيج الخبراء المستخدم في بعض نماذج اللغة الكبيرة مثل Mistral. أوضح ليانغ أن مزيج الخبراء يستخدم نموذجًا واحدًا مدربًا عبر مجموعات بيانات متعددة، مما قد يعرض الخصوصية للخطر.
في المقابل، يحافظ تكوين الخبراء على أمان كل نموذج من خلال تدريبه على مجموعات بيانات منفصلة وآمنة. يضمن هذا النهج أن تستمر بروتوكولات الأمان أثناء التدريب في التمديد إلى النشر والاستدلال.
حلول مخصصة تتجاوز التريليون معلمة
بينما يتباهى Samba-1 بتريليون معلمة، قد لا تحتاج المؤسسات دائمًا إلى هذا النطاق في النشر. من خلال الاستفادة من نماذج متخصصة متعددة، يوفر Samba-1 قدرات واسعة بشكل أكثر كفاءة.
قال ليانغ: "ليس كل تحفيز يتطلب تفعيل التريليون معلمة دفعة واحدة". يؤدي ذلك إلى تحسين الكفاءة وتقليل استهلاك الطاقة وعرض النطاق الترددي، مما يجعل الحمل التشغيلي أخف، حيث يتم استخدام الخبير الضروري فقط.
تمكّن SambaNova العملاء من تدريب نماذج على بياناتهم الخاصة، مما يسمح للشركات بتطوير أصول فريدة ومحسنة. أضاف ليانغ: "مع Samba-1، يمكنك امتلاك نموذجك الخاص بتريليون معلمة، وبمجرد تدريبه على بياناتك، يصبح ملكًا لك إلى الأبد".