أطلقت شركة Reka، الناشئة في مجال الذكاء الاصطناعي ومقرها في سان فرانسيسكو، نموذجها الجديد للغة متعدد الوسائط المعروف باسم Reka Core. يُعتبر هذا النموذج "الأكبر والأكثر قدرة" لدى الشركة، وقد تم تدريبه من الصفر باستخدام آلاف وحدات معالجة الرسوميات (GPUs).
يتوفر Reka Core اليوم عبر واجهة برمجة التطبيقات (API) أو على أجهزة داخلية أو على الأجهزة الشخصية. يُعد هذا النموذج الإضافة الثالثة لعائلة نماذج اللغة في الشركة، حيث يتفوق في فهم الوسائط المتعددة، بما في ذلك النصوص والصور والصوت والفيديو. على الرغم من تدريبه في أقل من عام، إلا أن أدائه ينافس عمالقة الصناعة مثل OpenAI وGoogle وAnthropic.
قال داني يوجاتاما، المؤسس المشارك والمدير التنفيذي للشركة المكونة من 22 شخصًا: "تمنحنا القدرة على تدريب نماذج عالية الأداء في فترة زمنية قصيرة ميزة كبيرة".
تم اختبار Reka Core على مسلسل "مشكلة الأجسام الثلاثة" من Netflix، حيث نجح في تحويل الأحداث المعروضة على الشاشة إلى نصوص. وأكد يي تاي، عالم الأبحاث الكبير والمؤسس المشارك، أن النموذج تم تطويره باستخدام "آلاف وحدات H100". وعلى الرغم من المنافسة مع نماذج رائدة مثل GPT-4 من OpenAI وClaude 3 Opus من Anthropic، فإن تاي أوضح أن أداء Core لا يزال يتحسن.
ماذا يقدم Reka Core؟
بينما لا يزال العدد الدقيق للمعلمات في Reka Core غير مُعلن، يُوصف بأنه "نموذج كبير جداً" (حيث يحتوي الإصدار السابق Reka Flash على 21 مليار معلمة). تم تدريبه على مجموعة متنوعة من مصادر البيانات، بما في ذلك البيانات المرخصة والمتاحة للجمهور والبيانات الاصطناعية في صيغ النصوص والصوت والفيديو والصور. تسمح هذه التدريبات الشاملة لـ Reka Core بمعالجة الوسائط المتعددة والرد بدقة عبر مجالات متعددة، مثل الرياضيات والترميز، مع قدرة استدلال استثنائية. يدعم 32 لغة ولديه نافذة سياق ممتدة تصل إلى 128,000 رمز، مما يجعله مناسبًا للعمل مع الوثائق الطويلة. أشار يوجاتاما إلى أن Core هو النموذج الثاني فقط بعد نموذج Gemini Ultra من Google الذي يشمل جميع الوسائط ويقدم مخرجات عالية الجودة.
في اختبارات الأداء، تفوق Reka Core على Gemini Ultra في إدراك الفيديو، مُسجلاً 59.3 مقابل 54.3. وفي معيار MMMU لمهام الصور، جاء مباشرة خلف GPT-4 (56.8) وClaude 3 Opus (59.4) وGemini Ultra (59.4) مسجلاً 56.3. بالمقابل، سجل نموذج Grok الذي طورته xAI التابعة لإيلون ماسك 53.6 فقط. تم تصنيف Reka Core كأفضل نموذج ثاني في الأداء المتعدد الوسائط.
علاوة على ذلك، لاقى Core أداءً متساويًا أو متفوقًا على نماذج بارزة في مختلف المعايير. في اختبارات الـ MMLU للمعرفة، سجل 83.2، مُتبعًا عن كثب GPT-4 وClaude 3 Opus وGemini Ultra. بالإضافة إلى ذلك، تفوق في مهام الاستدلال والترميز، مُسجلًا 92.2 و76.8 على التوالي.
لتحقيق مثل هذا الأداء في فترة زمنية قصيرة، اعتمدت الشركة نهج تطوير عكسي. بدلاً من التدريب التقليدي للنموذج، قامت بتحديد هدف أداء دقيق وعادت إلى تحديد حجم البيانات ومتطلبات الـ GPU اللازمة لتحقيقه.
الشراكات والخطط المستقبلية
تركز Reka على القدرات متعددة الوسائط والأسعار التنافسية، حيث تسعى لاستكشاف استخدامات متنوعة عبر صناعات مثل التجارة الإلكترونية، والألعاب، والرعاية الصحية، والروبوتات. وللمقارنة، يتقاضى نموذج GPT-4 Turbo من OpenAI نفس السعر للرموز المدخلة ولكنه يفرض 30 دولارًا للرموز المخرجة.
على الرغم من أن Reka لا تزال في مراحلها المبكرة، فإنها تعمل بنشاط لتحدي هيمنة السوق لشركات مثل OpenAI وAnthropic وGoogle. وقد بدأت الشركة بالفعل شراكات مع بعض الشركاء في الصناعة، حيث أدرجت Snowflake مؤخرًا Reka Core وFlash في خدمتها Cortex لتطوير تطبيقات نماذج اللغة. هناك أيضًا شراكات مع Oracle وAI Singapore، التي تجمع المؤسسات البحثية في سنغافورة.
أشار يوجاتاما إلى أن انطلاق نماذج Reka الأولية (Flash وEdge) قد أثار اهتمامًا قويًا من الشركات، مما أدى إلى زيادة عدد العملاء. ومن المتوقع أن يتم الكشف عن مزيد من التفاصيل حول الشراكات قريبًا.
بعد العام الأول الذي ركز على إدخال النماذج إلى السوق، تخطط Reka لتعزيز عروضها مع توسيع العمليات التجارية. يلتزم الفريق بتحسين أداء Core وتطوير الإصدار التالي في ذات الوقت.
على الرغم من التقدم المستمر، أوضح يوجاتاما أن الشركة ليس لديها خطط فورية لجعل تقنيتها مفتوحة المصدر. هو يدعم مبادئ المصدر المفتوح ولكن يركز على ضرورة تحقيق التوازن في ما يُشارك لضمان نمو الأعمال بشكل مستدام.
تظهر Reka Core كأحد اللاعبين الواعدين في مشهد الذكاء الاصطناعي التنافسي، حيث تقدم إمكانيات مثيرة تنافس النماذج الرائدة في السوق اليوم.