إنفيديا، هاجنغ فيس، وسيرفس ناو يطلقون نماذج StarCoder2 الجديدة لتعزيز قدرات توليد الشفرات.

أطلقت Nvidia وHugging Face وServiceNow StarCoder2، مجموعة متقدمة من النماذج اللغوية الكبيرة المفتوحة المصدر (LLMs) المصممة لتعزيز توليد الكود المدعوم بالذكاء الاصطناعي. تتوفر هذه النماذج حاليًا بثلاثة أحجام، وقد تم تدريبها على أكثر من 600 لغة برمجة، بما في ذلك اللغات الأقل شهرة، مما يمكّن المؤسسات من تبسيط مختلف مهام البرمجة ضمن سير العمل في تطوير البرمجيات. تم تطويرها كجزء من مشروع BigCode المفتوح، وهو مبادرة تعاونية بين ServiceNow وHugging Face، حيث تعزز النماذج الاستخدام المسؤول للنماذج اللغوية الكبيرة لتوليد الكود وتُقدم دون حقوق ملكية بموجب تراخيص الذكاء الاصطناعي المسؤول المفتوح (OpenRAIL).

وقال هارم دي فريز، رئيس فريق تطوير StarCoder2 في ServiceNow: “يُظهر StarCoder2 قوة التعاون العلمي المفتوح مع ممارسات الذكاء الاصطناعي المسؤول. هذا النموذج المتطور يعزز من إنتاجية المطورين ويجعل الوصول إلى ذكاء توليد الكود متاحًا لجميع المؤسسات، مما يساعدهم في تحقيق إمكاناتهم التجارية الكاملة.”

StarCoder2: ثلاثة نماذج لتلبية احتياجات متنوعة

تضمن نموذج StarCoder الأصلي نموذجًا واحدًا بقدرة 15 مليار معلمة تم تدريبه على 80 لغة برمجة. في المقابل، يقدم StarCoder2 ثلاثة أحجام متميزة—3B و7B و15B—تم تدريبها على 619 لغة برمجة. مجموعة بيانات التدريب، المعروفة باسم The Stack، أكبر بأكثر من سبع مرات مقارنة بسابقتها.

لقد تم تنفيذ تقنيات تدريب جديدة لتعزيز قدرة النماذج على فهم وتوليد الكود في اللغات ذات الموارد المحدودة، مثل COBOL، بالإضافة إلى التعبيرات الرياضية ومناقشات شفرة المصدر للبرامج. يستخدم نموذج 3B إطار عمل Fast LLM من ServiceNow، بينما يعتمد نموذج 7B على إطار عمل nanotron من Hugging Face. تم تصميم كلاهما لتحقيق أداء عالٍ في توليد النص إلى كود وتوليد سير العمل مع تقليل متطلبات الحوسبة. بينما يتم تحسين نموذج 15B باستخدام إطار العمل السحابي Nvidia NeMo وبرمجيات Nvidia TensorRT-LLM.

الابتكار التعاوني: ServiceNow وHugging Face وNvidia

بينما لا يزال أداء هذه النماذج في سيناريوهات الترميز المختلفة قيد الملاحظة، تشير الاختبارات الأولية إلى أن نموذج 3B يقدم أداءً مماثلاً لنموذج StarCoder الأصلي بقدرة 15B. يمكن للفرق المؤسسية تخصيص أي من هذه النماذج باستخدام بياناتها التنظيمية لتطبيقات محددة تشمل توليد الشفرات، وأتمتة سير العمل، وإكمال الشفرات، والتلخيص المتقدم، واسترجاع المقتطفات.

تعزز مجموعة التدريب الواسعة من قدرتها على تقديم توقعات دقيقة مدركة للسياق، مما يسرع من عمليات التطوير ويسمح للمهندسين بالتركيز على التحديات الأكثر أهمية. وأشار جوناثان كوهين، نائب رئيس الأبحاث التطبيقية في Nvidia، قائلاً: “يتميز كل نظام بيئي للبرمجيات بلغة برمجة فريدة، ويمكن أن تعزز نماذج الكود LLM تحقيق تقدم كبير في الكفاءة والابتكار عبر الصناعات. شراكتنا مع ServiceNow وHugging Face توفر نماذج آمنة تم تطويرها بشكل مسؤول، مما يوسع الوصول إلى الذكاء الاصطناعي المتولد المسؤول للمجتمع العالمي.”

بدء الاستخدام مع StarCoder2

جميع نماذج عائلة StarCoder2 متاحة تحت ترخيص Open RAIL-M، مما يوفر الوصول دون حقوق ملكية. يمكن العثور على الشيفرة الداعمة في مستودع GitHub لمشروع BigCode، كما يمكن تنزيل النماذج أيضًا من Hugging Face. بالإضافة إلى ذلك، يمكن الوصول إلى نموذج 15B عبر Nvidia AI Foundation، مما يمكّن المطورين من التجربة مباشرة من متصفحاتهم أو عبر واجهة برمجة التطبيقات (API).

بينما يمثل StarCoder تقدمًا مهمًا في توليد الكود المدعوم بالذكاء الاصطناعي، إلا أنه ليس وحيدًا في هذا المجال. يستكشف المنافسون مثل OpenAI مع Codex (الذي يُشغل GitHub Copilot) وAmazon’s CodeWhisper وغيرهم مثل Replit وCodenium أيضًا قدرات النماذج اللغوية الكبيرة في تطوير التطبيقات.

Most people like

Find AI tools in YBX