إيلون ماسك يكشف عن Grok-1.5: يقترب من معايير أداء GPT-4

بعد أسابيع قليلة من إطلاق Grok-1 كبرنامج مفتوح المصدر، يستعد xAI التابع لإيلون ماسك لإصدار النسخة المحسنة من نموذج اللغة الكبير الخاص به — Grok-1.5 الأسبوع المقبل. تهدف Grok-1.5 إلى تعزيز قدرات التفكير وحل المشكلات، مما يجعل أدائها يقترب من النماذج المعروفة مثل GPT-4 من OpenAI وClaude 3 من Anthropic. رغم قدرتها على التعامل مع سياقات طويلة، إلا أنها لا تزال متأخرة عن Gemini 1.5 Pro، الذي يدعم نافذة سياق تصل إلى مليون رمز.

ما الجديد في Grok-1.5؟

تم الإعلان عن Grok-1 في نوفمبر الماضي، مستلهمًا من كتاب "دليل المسافر إلى المجرة"، وقد صُمم لمساعدة المستخدمين في سعيهم للمعرفة بغض النظر عن خلفياتهم أو مواقفهم السياسية. أظهر Grok-1 في الاختبارات السابقة أداءً أفضل من Llama-2-70B وGPT-3.5.

تدعي xAI أن Grok-1.5 قد حققت تحسينات ملحوظة عبر مقاييس رئيسية. في الاختبارات، حصلت Grok-1.5 على 50.6% في معيار MATH، و90% في معيار GSM8K، و74.1% في معيار HumanEval، مما يدل على تحسينات كبيرة في المهام المتعلقة بالبرمجة والرياضيات. بالإضافة إلى ذلك، سجلت Grok-1.5 81.3% في معيار MMLU، مما يعكس تقدمًا ملحوظًا مقارنةً بـ Grok-1 الذي حقق 73%. مع نافذة سياق تصل إلى 128,000 رمز، يمكن لـ Grok-1.5 معالجة معلومات أكثر بكثير — بمعدل 16 ضعف سابقتها — مما يجعلها بارعة في تحليل وتلخيص الوثائق الطويلة مع الحفاظ على قدرة فعالة على اتباع التعليمات.

المنافسة مع النماذج الرائدة

لا تتفوق Grok-1.5 فقط على Grok-1، بل تضيق الفجوة في الأداء مع نماذج رائدة مثل Gemini 1.5 Pro وGPT-4 وClaude 3. على سبيل المثال، سجلت Grok-1.5 في معيار MMLU 81.3%، متفوقةً على Mistral Large التي تم إصدارها مؤخرًا، لكنها لا تزال خلف Gemini 1.5 Pro التي حققت 83.7% وGPT-4 التي سجلت 86.4% وClaude 3 Opus التي حصلت على 86.8%. في معيار GSM8K، تظل Grok-1.5 متأخرة قليلاً عن العروض المقدمة من Google وOpenAI وAnthropic. الجدير بالذكر أن Grok-1.5 تتفوق في معيار HumanEval، متفوقة على جميع النماذج باستثناء Claude 3 Opus.

يتوقع براين روميل، المستشار التقني، أن يثبت Grok-2، الذي يتدرب حاليًا، نفسه كواحد من أقوى منصات الذكاء الاصطناعي عند إصداره، متفوقًا على OpenAI في العديد من المقاييس.

توافر Grok-1.5

تخطط xAI لإطلاق Grok-1.5 الأسبوع المقبل، بدءًا من المختبرين الأوائل ومستخدمي روبوت الدردشة Grok على منصة X (التي كانت تُعرف سابقًا بتويتر). سيتم إطلاق النسخة على مراحل، حيث يتم إدخال ميزات جديدة، بما في ذلك وضع "المرح" المحتمل، مع توسيع الوصول لمزيد من المستخدمين تدريجيًا.

كانت الإصدارات الأولية من Grok على X جزءًا من استراتيجية لتعزيز استخدام كل من Grok ومنصة X. Grok متاحة حاليًا من خلال اشتراك "Premium+" مقابل 16 دولارًا في الشهر، لكن ماسك أعلن مؤخرًا أنها ستكون متاحة لجميع المشتركين في مستوى Premium بمبلغ 8 دولارات في الشهر. بالإضافة إلى ذلك، سيحصل المتابعون الموثقون في بعض مستويات الاشتراك على مزايا Premium، بما في ذلك الوصول المجاني إلى Grok.

Most people like

Find AI tools in YBX