تعتبر نماذج اللغة أدوات قوية قادرة على إنتاج لغة طبيعية لمهام متنوعة، بما في ذلك التلخيص والترجمة والإجابة على الأسئلة وكتابة المقالات. ومع ذلك، فإن تدريب هذه النماذج وتشغيلها قد يكون مكلفًا، خاصة في المجالات المتخصصة التي تتطلب دقة عالية وزمن استجابة منخفض.
يتناول أحدث بحث لشركة Apple هذه القضية من خلال نهج مبتكر. تقدم ورقة الشركة الجديدة، "نماذج اللغة المتخصصة مع استدلال منخفض التكلفة من بيانات مجال محدود"، استراتيجية فعّالة من حيث التكلفة لتطوير الذكاء الاصطناعي، مما يجعل التكنولوجيات المتقدمة أكثر وصولاً للشركات التي كانت مترددة بسبب التكاليف العالية.
لقد استقطب البحث اهتمامًا سريعًا، حيث تم تسليط الضوء عليه في أوراق Hugging Face اليومية، مما يشير إلى تحول مهم في المشهد المالي لمشروعات الذكاء الاصطناعي. حدد الباحثون أربعة مجالات رئيسية للتكاليف: ميزانية ما قبل التدريب، ميزانية التخصص، ميزانية الاستدلال، وحجم مجموعة التدريب داخل المجال. ويشيرون إلى أن الإدارة الدقيقة لهذه المصاريف تمكن من إنشاء نماذج ذكاء اصطناعي فعّالة وبأسعار معقولة.
تحدي معالجة اللغة بتكلفة منخفضة
كما وضح الفريق، فإن المشكلة تكمن في أن "نماذج اللغة الكبيرة متعددة الاستخدامات ولكن يصعب تطبيقها دون ميزانيات استدلال كبيرة ومجموعات تدريب داخل المجال واسعة". لمواجهة ذلك، يقترحون مسارين رئيسيين: الشبكات الفائقة جنبًا إلى جنب مع تخاليط الخبراء لمن لديهم ميزانيات تدريب قبلية وفيرة، ونماذج أصغر يتم تدريبها انتقائيًا للبيئات التي تعاني من قيود مالية مشددة.
تقيّم الدراسة طرق التعلم الآلي المختلفة، بما في ذلك الشبكات الفائقة وتخاليط الخبراء واختيار العينات المهمة والتقطير، عبر ثلاثة مجالات: الطب الحيوي والقانون والأخبار. تشير النتائج إلى أن أداء النماذج يختلف بناءً على السياق. على سبيل المثال، تحقق الشبكات الفائقة وتخاليط الخبراء أفضلية في الدقة مع ميزانيات تدريب قبلية أكبر، بينما تثبت النماذج الأصغر المدربة على مجموعات بيانات مختارة بشكل حاسم فائدتها لمن لديهم تمويل تخصص محدود.
كما تقدم الورقة إرشادات عملية لاختيار الطريقة المثلى بناءً على المجال والميزانية. يؤكد المؤلفون أن أبحاثهم يمكن أن تعزز من إمكانية الوصول وفائدة نماذج اللغة في مجموعة واسعة من التطبيقات.
إحداث تغييرات في الصناعة مع نماذج اقتصادية
تساهم هذه الدراسة في مجموعة متزايدة من الأعمال التي تركز على تحسين كفاءة وقابلية ضبط نماذج اللغة. على سبيل المثال، تعاونت Hugging Face مؤخرًا مع Google لتسهيل إنشاء ومشاركة نماذج اللغة المتخصصة بطريقة سهلة لمختلف المجالات واللغات.
على الرغم من الحاجة إلى مزيد من التقييم للمهام اللاحقة، يبرز البحث التوازن بين إعادة تدريب نماذج الذكاء الاصطناعي الكبيرة وتكييف النماذج الأصغر والأكثر كفاءة. مع التقنيات الصحيحة، يمكن أن تحقق كلتا الاستراتيجيتين نتائج دقيقة. في جوهرها، تستنتج الأبحاث أن النموذج الأكثر فعالية ليس بالضرورة الأكبر، بل هو الأنسب لتطبيقه المقصود.