مهمة Tenyx في التغلب على النسيان الكارثي في نماذج اللغة الكبيرة: حل لتحسين أداء الذكاء الاصطناعي

Home أخبار الذكاء الاصطناعي مهمة Tenyx في التغلب على النسيان الكارثي في نماذج اللغة الكبيرة: حل لتحسين أداء الذكاء الاصطناعي

Updated on ديسمبر 12 2023

لزيادة فوائد نماذج اللغة الكبيرة (LLMs)، يجب على المؤسسات إجراء تحسينات دقيقة باستخدام بيانات متخصصة في المجال. تعزز هذه العملية قدرة النموذج على توليد مخرجات ذات صلة.

ومع ذلك، فإن تحسين النماذج المدربة مسبقاً يطرح تحدياً رئيسياً: إذ يمكن أن يؤدي ضبط الأوزان لأغراض توزيع بيانات مختلفة إلى "نسيان كارثي"، حيث يفقد النموذج المعرفة المكتسبة سابقاً. يؤثر هذا الانخفاض سلباً على أداء LLM ومهاراته في التفكير.

أعلنت شركة Voice AI، Tenyx، عن حل لتحسين النماذج مصمم لمواجهة هذه المشكلة. يتيح منصتهم للشركات تخصيص LLMs لتلبية احتياجاتها المحددة دون التنازل عن المعرفة الأساسية أو تدابير السلامة.

قال إيتامار آريل، الرئيس التنفيذي ومؤسس Tenyx: "يعتبر النسيان الكارثي مشكلة قائمة منذ فترة طويلة في مجتمع التعلم الآلي. كان يُفترض تقليدياً أن النماذج يمكن أن تتدرب باستمرار على بيانات جديدة مع الاحتفاظ بالمعلومات القديمة."

مخاطر تحسين النماذج

أشار آريل إلى أن تحسين النماذج أصبح أساسياً بشكل متزايد لتطبيقات المؤسسات المتعلقة بـ LLMs. ومع ذلك، يفتقر علماء البيانات غالبًا إلى الوصول الكامل إلى مجموعات بيانات التدريب الأصلية، وتفشل طرق التحسين التقليدية في التخفيف من تأثير النسيان. يمكن أن يؤدي ذلك إلى فقدان القدرات الأساسية ويعرض المنظمات لمحتوى ضار أو متحيز.

على سبيل المثال، يتطلب استخدام LLaMA 7B كتشات بوت لخدمة العملاء—وهو تطبيق شائع—تحسينه باستخدام تفاعلات العملاء النموذجية. قد تؤدي التقنيات القياسية، مثل التكيف منخفض الرتبة (LoRA)، بشكل غير متعمد إلى فقدان المعرفة القيمة، مثل الإجابة بدقة على سؤال "ما هي المسافة من الفندق إلى المطار؟" أو استنتاج السياق من عبارات مثل "سأصل في 7 ديسمبر لمدة أربع ليالٍ."

وأضاف آريل: "قد يتفوق النموذج المعدل في مهام معينة، ولكنه قد ينتج استجابات غير صحيحة أو متحيزة فيما يتعلق بالمعرفة والتفكير الأوسع."

قيود التكيف منخفض الرتبة

على الرغم من أن LoRA شائعة لكفاءتها في الحوسبة، أوضح آريل أنها لم تصمم لمعالجة النسيان الكارثي. عندما يؤدي تحسين النموذج إلى تغيير توزيع البيانات بعيدًا عن الأصل، قد تحدث تشوهات غير متوقعة.

قال آريل: "تشير نتائجنا إلى أنه رغم مزايا LoRA، إلا أنها تحمل نفس مخاطر فقدان المعرفة والتفكير." كما تعقد تعقيدات النموذج عملية تحديد وتصحيح هذه التشوهات. علاوة على ذلك، يمكن أن تؤدي طرق التحسين التقليدية إلى تقليل البروتوكولات الأمنية التي تم وضعها عبر التعلم المعزز من تعليقات البشر (RLHF)، وهي ضرورية لمنع المخرجات المتحيزة.

وأكد آريل: "إذ أن RLHF هو أيضًا عملية تدريب، فإنه يتأثر خلال عمليات التعديل."

عدم الكفاءة في استراتيجيات التخفيف الحالية

حاليًا، تحاول المؤسسات إدارة النسيان الكارثي من خلال الاعتماد على العديد من مهندسي التعلم الآلي لتقليل التحسين واستخدام هندسة الموجهات لتحقيق نتائج مثلى. ومع ذلك، فإن هذا النهج غير متسق ومكلف، ويفتقر إلى فهم واضح لوقت وسبب فعاليته. علاوة على ذلك، complicates تقييم المعرفة والتفكير أثناء تحسين النماذج عبر التدخل اليدوي، مما يعقد العملية دون إمكانيات أتمتة.

نهج Tenyx في تحسين النماذج

تحدد طريقة التحسين المبتكرة لـ Tenyx أي معلمات نموذج يمكن تحديثها للتعلم من بيانات جديدة مع الحفاظ على معظم الخرائط المدخلة-المخرجة السابقة. تضمن منصتهم أن التحديثات خلال التحسين لا تعطل قدرة النموذج على معالجة البيانات الأصلية.

قال آريل: "من خلال تحليل LLM المدرب، تحدد طريقتنا الأوزان المثلى للتحديث، مما يمكّن من التعلم من البيانات الجديدة مع تقليل النسيان الكارثي إلى الحد الأدنى." يستخدم نهج Tenyx تفسيرًا رياضيًا جديدًا للتمثيلات الهندسية التي تم تشكيلها خلال التدريب الأولي للـ LLM، مما يساعد على الحفاظ على المعلومات المكتسبة سابقًا مع استيعاب التغييرات.

الأهم من ذلك، تحافظ طريقة Tenyx على حماية RLHF وتتماشى مع الإرشادات التنظيمية، بما في ذلك الأمر التنفيذي للبيت الأبيض بشأن الذكاء الاصطناعي الآمن والموثوق.

نتائج طريقة تحسين Tenyx

في دراسة تجريبية تقيّم خوارزميات تحسين شائعة للمؤسسات والمصادر المفتوحة، أظهرت Tenyx مزايا ملحوظة في السلامة والكفاءة واحتفاظ المعرفة:

- السلامة: حققت Tenyx تقليلاً بنسبة 11% في المخاطر، متجاوزةً OpenAI (-66%) وTogether AI (-94%) وLoRA (-91%).

- الكفاءة: رغم أن GPT 3.5 Turbo من OpenAI أظهر كفاءة أعلى في البداية بسبب معاييره، تفوقت Llama-2 7B من Tenyx بعد تحسينها.

- المعرفة: سجلت Tenyx فقداً بنسبة 3% فقط في النسيان الكارثي، مقارنةً بـ 10% من OpenAI و40% من Together AI و43% من LoRA.

أشار نواه غودمان، أستاذ مشارك في جامعة ستانفورد: "لا يزال النسيان الكارثي عقبة معترف بها في التعلم العميق، تؤثر حتى على النماذج الأكثر تقدماً." وأضاف غودمان: "عندما تحسن النماذج على بيانات مجال جديدة، فإنها عادةً ما تعزز الأداء في هذا المجال ولكن مع خطر تغيير القدرات المحددة."

وأنهى غودمان حديثه، قائلاً: "تمتلك Tenyx فريق أبحاث قوي يستكشف حلول مبتكرة لمعالجة هذا التحدي المعقد."

مايكروسوفت تكشف عن Phi-2: نموذج لغوي متكامل يتفوق على Llama 2 وMistral 7B من حيث الأداء.

تساعد Cohere الشركات على بناء أنظمة ذكاء اصطناعي باستخدام بيانات Slack و Google Drive.

Most people like

nele.ai

11.4K

في عالم الأعمال الرقمي اليوم، تعمل الذكاء الاصطناعي على تحويل العمليات التجارية، لكنه أيضًا يطرح تحديات أمنية كبيرة. يجب على المؤسسات أن تعطي الأولوية للحلول الآمنة للذكاء الاصطناعي لحماية بياناتها الحساسة والحفاظ على الامتثال، بينما تستفيد من قوة الذكاء الاصطناعي من أجل الابتكار والكفاءة. تستعرض هذه الدليل استراتيجيات وأفضل الممارسات لتنفيذ الذكاء الاصطناعي الآمن في المؤسسات، مما يضمن حماية قوية للبيانات وزيادة القدرة على الصمود أمام التهديدات الإلكترونية المتطورة. اكتشف كيف يمكن أن يمكّن دمج الذكاء الاصطناعي الآمن مؤسستك من الازدهار مع الحفاظ على الحماية ضد المخاطر المحتملة.

الذكاء الاصطناعي للمؤسسات Other

Immersive Translate

2.5M

نقدم لكم أداة ترجمة ثنائية اللغة مجانية للصفحات الإلكترونية والمستندات، تهدف إلى جعل الترجمة سهلة ومتاحة للجميع. سواء كنت بحاجة إلى تحويل محتوى موقع إلكتروني أو مستندات مهمة، تضمن منصتنا السهلة الاستخدام تواصلًا واضحًا بعدة لغات، مما يمكّنك من التواصل مع جمهور عالمي بلا جهد. ترجم بسهولة وحقق وجودًا قويًا على الإنترنت اليوم!

ترجمة Translate

Career.io

388K

اكتشف إمكانياتك المهنية مع منصة خدماتنا المهنية المدعومة بالذكاء الاصطناعي استمتع بدعم لا مثيل له في رحلتك المهنية مع منصتنا المبتكرة لخدمات الوظائف المدفوعة بالذكاء الاصطناعي. تم تصميمها لتعزيز نجاحك، حيث نقدم موارد مخصصة وإرشادات خبراء مصممة وفقًا لأهدافك المهنية الفريدة. اتخذ الخطوة الأولى نحو تحقيق طموحاتك اليوم!

خدمات التوظيف AI Recruiting

Submagic

5.3M

قم بإنشاء عناوين جذابة مليئة بالرموز التعبيرية لمحتواك القصير. تفاعل مع جمهورك واجعل منشوراتك تبرز!

تسميات الذكاء الاصطناعي Captions or Subtitle

Find AI tools in YBX