يُعتبر تحسين النماذج (Fine-tuning) عملية أساسية لتعزيز مخرجات نماذج اللغة الكبيرة (LLMs) وتكييفها مع احتياجات الشركات الخاصة. عندما يتم تنفيذ هذه العملية بشكل صحيح، تُنتج نماذج أكثر دقة وقيمة، مما يُمكن المنظمات من تحقيق أقصى استفادة من تطبيقات الذكاء الاصطناعي التوليدية. ومع ذلك، قد يكون تحسين النماذج مكلفًا، مما يخلق عوائق أمام بعض الشركات الراغبة في الاستفادة من هذه القدرات المتقدمة.
تدخل شركة Mistral، موفر نماذج الذكاء الاصطناعي مفتوح المصدر، ساحة تحسين النماذج بعد أن اقتربت من تقييم 6 مليارات دولار في غضون 14 شهرًا فقط من إطلاقها. تقدم منصتها الجديدة للمطورين، La Plateforme، أدوات تخصيص معززة تهدف إلى تسهيل عمليات تحسين النماذج، وتقليل تكاليف التدريب، وخفض العوائق أمام الدخول.
تعكس اسم "Mistral" رياحًا قوية في جنوب فرنسا، مما يجعلها تتقدم في مجال الذكاء الاصطناعي، وتجذب تمويلات كبيرة من خلال الابتكار المستمر. تشير الشركة في مدونة حديثة إلى أن تحسين النماذج الصغيرة لمجالات محددة يمكن أن يعزز الأداء مع تقليل تكاليف النشر وتسريع سرعات التطبيقات.
تخصيص نماذج Mistral لزيادة التخصيص
أسست Mistral نفسها من خلال إصدار نماذج قوية مفتوحة المصدر، مما يسمح بالتكيف المجاني. كما تقدم خدمات مدفوعة، بما في ذلك واجهة برمجة التطبيقات (API) ومنصة La Plateforme للمطورين. يمكن للمستخدمين الآن تخصيص نماذج Mistral على La Plateforme، واستخدام الأكواد المفتوحة المصدر من Mistral على GitHub، أو الوصول إلى خدمات التدريب المخصص.
للمطورين الذين يرغبون في العمل بشكل مستقل، أطلقت Mistral قاعدة الأكواد الخفيفة "mistral-finetune"، التي تستخدم نموذج LoRA لتقليل عدد المعلمات القابلة للتدريب.
تلاحظ Mistral، "مع mistral-finetune، يمكنك تحسين كل نماذجنا مفتوحة المصدر على بنيتك التحتية دون التضحية بالأداء أو كفاءة الذاكرة."
بالنسبة لأولئك المهتمين بتحسين النماذج بدون خوادم، تقدم Mistral خدمات جديدة تستفيد من تقنيات البحث والتطوير المتقدمة. تساعد المحولات LoRA في الحفاظ على المعرفة الأساسية للنماذج مع تمكين النشر بكفاءة. تصف Mistral هذا بأنه تقدم كبير في جعل الأساليب العلمية المتطورة متاحة لمطوري تطبيقات الذكاء الاصطناعي، مما يسمح بتخصيص سريع وفعال للنماذج.
تتوافق خدمات تحسين النماذج مع نموذج Mistral 7B الذي يحتوي على 7.3 مليار معلمة. يمكن للمستخدمين الحاليين الاستفادة من واجهة برمجة التطبيقات (API) الخاصة بـ Mistral لتخصيص فوري، مع خطط لطرح نماذج إضافية لتحسين الأداء في الأسابيع القادمة.
علاوة على ذلك، تعمل خدمات التدريب المخصصة من Mistral على تحسين نماذج الذكاء الاصطناعي لتطبيقات محددة باستخدام بيانات خاصة، وغالبًا ما تستخدم تقنيات متقدمة مثل التدريب المسبق المستمر لإدماج المعرفة المتخصصة. تسهل هذه الطريقة تطوير نماذج متخصصة وعالية الكفاءة لمجالات معينة.
احتفالًا بعرض هذه الخدمات الجديدة، أطلقت Mistral هاكاثون لتحسين نماذج الذكاء الاصطناعي حتى 30 يونيو، تشجع المطورين على تجربة واجهة برمجة التطبيقات الجديدة والمبتكرة للشركة.
نمو Mistral السريع وابتكاراتها
منذ إنشائها في أبريل 2023 على يد موظفين سابقين في Google DeepMind وMeta، شهدت Mistral نموًا سريعًا. حصلت الشركة على جولة تمويل أولية بقيمة 118 مليون دولار، وهي الأكبر في تاريخ أوروبا، وسرعان ما شكلت شراكات مع شركات كبرى مثل IBM. في فبراير، أصبح Mistral Large متاحًا من خلال تعاون مع Microsoft على منصة Azure السحابية.
مؤخراً، أعلنت كل من SAP وCisco دعمهما لـ Mistral، وفي الشهر الماضي، أطلقت الشركة "Codestral"، أول نموذج لغة متوجه نحو الكود، زاعمة أنه يتفوق على جميع المنافسين. تقترب Mistral أيضًا من جولة تمويل ضخمة بقيمة 600 مليون دولار، مما قد يرفع تقييمها إلى 6 مليارات دولار.
تسعى Mistral لأن تكون منافساً مباشراً لـ OpenAI ونموذج Llama 3 من Meta، مع كون Mistral Large هو ثاني أقوى نموذج لغة تجاري على مستوى العالم بعد نموذج GPT-4 من OpenAI. ويزعم Mistral 7B الذي تم تقديمه في سبتمبر 2023 أنه يتفوق على Llama في عدة معايير ويطابق أداء CodeLlama 7B في مهام البرمجة.
ما الابتكارات التي ستكشف عنها Mistral قريبًا؟ سنكتشف ذلك قريباً.