لزيادة فوائد نماذج اللغة الكبيرة (LLMs)، يجب على المؤسسات إجراء تحسينات دقيقة باستخدام بيانات متخصصة في المجال. تعزز هذه العملية قدرة النموذج على توليد مخرجات ذات صلة.
ومع ذلك، فإن تحسين النماذج المدربة مسبقاً يطرح تحدياً رئيسياً: إذ يمكن أن يؤدي ضبط الأوزان لأغراض توزيع بيانات مختلفة إلى "نسيان كارثي"، حيث يفقد النموذج المعرفة المكتسبة سابقاً. يؤثر هذا الانخفاض سلباً على أداء LLM ومهاراته في التفكير.
أعلنت شركة Voice AI، Tenyx، عن حل لتحسين النماذج مصمم لمواجهة هذه المشكلة. يتيح منصتهم للشركات تخصيص LLMs لتلبية احتياجاتها المحددة دون التنازل عن المعرفة الأساسية أو تدابير السلامة.
قال إيتامار آريل، الرئيس التنفيذي ومؤسس Tenyx: "يعتبر النسيان الكارثي مشكلة قائمة منذ فترة طويلة في مجتمع التعلم الآلي. كان يُفترض تقليدياً أن النماذج يمكن أن تتدرب باستمرار على بيانات جديدة مع الاحتفاظ بالمعلومات القديمة."
مخاطر تحسين النماذج
أشار آريل إلى أن تحسين النماذج أصبح أساسياً بشكل متزايد لتطبيقات المؤسسات المتعلقة بـ LLMs. ومع ذلك، يفتقر علماء البيانات غالبًا إلى الوصول الكامل إلى مجموعات بيانات التدريب الأصلية، وتفشل طرق التحسين التقليدية في التخفيف من تأثير النسيان. يمكن أن يؤدي ذلك إلى فقدان القدرات الأساسية ويعرض المنظمات لمحتوى ضار أو متحيز.
على سبيل المثال، يتطلب استخدام LLaMA 7B كتشات بوت لخدمة العملاء—وهو تطبيق شائع—تحسينه باستخدام تفاعلات العملاء النموذجية. قد تؤدي التقنيات القياسية، مثل التكيف منخفض الرتبة (LoRA)، بشكل غير متعمد إلى فقدان المعرفة القيمة، مثل الإجابة بدقة على سؤال "ما هي المسافة من الفندق إلى المطار؟" أو استنتاج السياق من عبارات مثل "سأصل في 7 ديسمبر لمدة أربع ليالٍ."
وأضاف آريل: "قد يتفوق النموذج المعدل في مهام معينة، ولكنه قد ينتج استجابات غير صحيحة أو متحيزة فيما يتعلق بالمعرفة والتفكير الأوسع."
قيود التكيف منخفض الرتبة
على الرغم من أن LoRA شائعة لكفاءتها في الحوسبة، أوضح آريل أنها لم تصمم لمعالجة النسيان الكارثي. عندما يؤدي تحسين النموذج إلى تغيير توزيع البيانات بعيدًا عن الأصل، قد تحدث تشوهات غير متوقعة.
قال آريل: "تشير نتائجنا إلى أنه رغم مزايا LoRA، إلا أنها تحمل نفس مخاطر فقدان المعرفة والتفكير." كما تعقد تعقيدات النموذج عملية تحديد وتصحيح هذه التشوهات. علاوة على ذلك، يمكن أن تؤدي طرق التحسين التقليدية إلى تقليل البروتوكولات الأمنية التي تم وضعها عبر التعلم المعزز من تعليقات البشر (RLHF)، وهي ضرورية لمنع المخرجات المتحيزة.
وأكد آريل: "إذ أن RLHF هو أيضًا عملية تدريب، فإنه يتأثر خلال عمليات التعديل."
عدم الكفاءة في استراتيجيات التخفيف الحالية
حاليًا، تحاول المؤسسات إدارة النسيان الكارثي من خلال الاعتماد على العديد من مهندسي التعلم الآلي لتقليل التحسين واستخدام هندسة الموجهات لتحقيق نتائج مثلى. ومع ذلك، فإن هذا النهج غير متسق ومكلف، ويفتقر إلى فهم واضح لوقت وسبب فعاليته. علاوة على ذلك، complicates تقييم المعرفة والتفكير أثناء تحسين النماذج عبر التدخل اليدوي، مما يعقد العملية دون إمكانيات أتمتة.
نهج Tenyx في تحسين النماذج
تحدد طريقة التحسين المبتكرة لـ Tenyx أي معلمات نموذج يمكن تحديثها للتعلم من بيانات جديدة مع الحفاظ على معظم الخرائط المدخلة-المخرجة السابقة. تضمن منصتهم أن التحديثات خلال التحسين لا تعطل قدرة النموذج على معالجة البيانات الأصلية.
قال آريل: "من خلال تحليل LLM المدرب، تحدد طريقتنا الأوزان المثلى للتحديث، مما يمكّن من التعلم من البيانات الجديدة مع تقليل النسيان الكارثي إلى الحد الأدنى." يستخدم نهج Tenyx تفسيرًا رياضيًا جديدًا للتمثيلات الهندسية التي تم تشكيلها خلال التدريب الأولي للـ LLM، مما يساعد على الحفاظ على المعلومات المكتسبة سابقًا مع استيعاب التغييرات.
الأهم من ذلك، تحافظ طريقة Tenyx على حماية RLHF وتتماشى مع الإرشادات التنظيمية، بما في ذلك الأمر التنفيذي للبيت الأبيض بشأن الذكاء الاصطناعي الآمن والموثوق.
نتائج طريقة تحسين Tenyx
في دراسة تجريبية تقيّم خوارزميات تحسين شائعة للمؤسسات والمصادر المفتوحة، أظهرت Tenyx مزايا ملحوظة في السلامة والكفاءة واحتفاظ المعرفة:
- السلامة: حققت Tenyx تقليلاً بنسبة 11% في المخاطر، متجاوزةً OpenAI (-66%) وTogether AI (-94%) وLoRA (-91%).
- الكفاءة: رغم أن GPT 3.5 Turbo من OpenAI أظهر كفاءة أعلى في البداية بسبب معاييره، تفوقت Llama-2 7B من Tenyx بعد تحسينها.
- المعرفة: سجلت Tenyx فقداً بنسبة 3% فقط في النسيان الكارثي، مقارنةً بـ 10% من OpenAI و40% من Together AI و43% من LoRA.
أشار نواه غودمان، أستاذ مشارك في جامعة ستانفورد: "لا يزال النسيان الكارثي عقبة معترف بها في التعلم العميق، تؤثر حتى على النماذج الأكثر تقدماً." وأضاف غودمان: "عندما تحسن النماذج على بيانات مجال جديدة، فإنها عادةً ما تعزز الأداء في هذا المجال ولكن مع خطر تغيير القدرات المحددة."
وأنهى غودمان حديثه، قائلاً: "تمتلك Tenyx فريق أبحاث قوي يستكشف حلول مبتكرة لمعالجة هذا التحدي المعقد."