كشفت Meta AI، الشركة المطورة لـ Llama 2، عن Code Llama 70B، نموذج متقدم لتوليد الشيفرات قادر على الكتابة بعدة لغات برمجة مثل بايثون، C++، جافا، وPHP بناءً على تعليمات اللغة الطبيعية أو مقتطفات من الشيفرات الحالية. يعد هذا النموذج الجديد بتوليد الشيفرات بسرعة ودقة وكفاءة غير مسبوقة.
يعتبر Code Llama 70B من أكبر نماذج الذكاء الاصطناعي مفتوحة المصدر لتوليد الشيفرات المتاحة اليوم، حيث يحقق معياراً جديداً في الذكاء الاصطناعي. يسعى علماء الكمبيوتر منذ زمن طويل إلى تحسين تطوير البرمجيات وفتح آفاق جديدة للإبداع. مع Code Llama 70B، يمكن للمستخدمين توجيه النموذج لتوليد الشيفرات، وتعديل الشيفرات القائمة بسهولة، أو تحويل الشيفرات بين لغات مختلفة.
ومع ذلك، تواجه عملية توليد الشيفرات تحديات فريدة. بخلاف الطبيعة المرنة للغة الطبيعية، تتطلب البرمجة الدقة والالتزام بقواعد صياغة صارمة. بالإضافة إلى ذلك، قد تكون المهام البرمجية معقدة وتحتاج إلى سياق واسع. تتناول النماذج المتقدمة مثل Code Llama 70B هذه العقبات من خلال تدريب على بيانات ضخمة، طاقة حسابية هائلة، وذكاء متطور.
يمثل Code Llama 70B نموذج لغة كبير متطور (LLM) تم تدريبه على 500 مليار توكن من بيانات ذات صلة بالشيفرات. تُجهز هذه التدريب النموذج بسياق أوسع بمدى 100,000 توكن، مما يمكّنه من توليد وفهم هياكل الشيفرات المعقدة.
مبني على Llama 2، أحد أكبر نماذج LLM مع 175 مليار معلمة، تم تحسين Code Llama 70B لتوليد الشيفرات من خلال تقنية تُسمى الانتباه الذاتي، التي تعزز من قدرته على تمييز العلاقات داخل الشيفرة.
معايير جديدة في الدقة والتكيف
تتميز Code Llama 70B بإصدار CodeLlama-70B-Instruct، وهو نسخة مُحسّنة خصيصًا لتفسير تعليمات اللغة الطبيعية. حقق هذا الإصدار درجة 67.8 في اختبار HumanEval، الذي يقيم الدقة الوظيفية لتوليد الشيفرات، متفوقاً على نماذج مفتوحة مسبقة مثل CodeGen-16B-Mono (29.3) وStarCoder (40.1)، واقترب من درجات نماذج مغلقة مثل GPT-4 (68.2) وGemini Pro (69.4). يتعامل CodeLlama-70B-Instruct بكفاءة مع مهام مثل فرز البيانات، والبحث، وتنفيذ الخوارزميات.
بالإضافة إلى ذلك، تتضمن Code Llama 70B إصدار CodeLlama-70B-Python، المصمم خصيصًا للغة بايثون، واحدة من أكثر لغات البرمجة شهرة في العالم. تم تدريبه على 100 مليار توكن إضافية من شيفرة بايثون، مما يجعله متفوقًا في مهام تشمل استخراج البيانات، وتحليل البيانات، وتعلم الآلة، وتطوير الويب.
متاح للبحث والاستخدام التجاري
يتوفر Code Llama 70B للتنزيل مجانًا تحت نفس ترخيص Llama 2، مما يمنح الباحثين والمستخدمين التجاريين الحرية في استخدامه وتعديله. يمكن الوصول إلى النموذج عبر منصات مثل Hugging Face وPyTorch وTensorFlow وJupyter Notebook. تقدم Meta AI وثائق ودروس للمستخدمين الراغبين في تكييف النموذج لمختلف التطبيقات.
أعرب مارك زوكربيرج، الرئيس التنفيذي لـ Meta AI، عن حماسه لهذا الإصدار، قائلاً: "نحن مفتوحون لمصدر Code Llama الجديد والمحسن بنموذج أكبر يحتوي على 70 مليار معلمة. كتابة وتعديل الشيفرات هو أحد أهم استخدامات الذكاء الاصطناعي اليوم. تُعتبر القدرة على البرمجة أمرًا حيويًا لتعزيز قدرة نماذج الذكاء الاصطناعي على معالجة المعلومات عبر مجالات متنوعة. أتطلع إلى دمج هذه التقدمات في Llama 3 والنماذج المستقبلية."
يُعتبر Code Llama 70B أداة قوية من شأنها أن تؤثر بشكل كبير على توليد الشيفرات ومشهد تطوير البرمجيات، حيث يوفر أداة مفيدة للتشفير والتعلم. يسهل هذا النموذج على الطامحين في البرمجة بتقديم إرشادات عبر اللغة الطبيعية، وقد يمهد الطريق لتطبيقات مبتكرة مثل ترجمة الشيفرات، والتلخيص، والتوثيق، والتحليل، وتصحيح الأخطاء.
يمكنك تحميل Code Llama 70B مباشرة من قنوات Meta AI لمزيد من المعلومات والوصول إلى الوثائق على GitHub وHugging Face.