تطرح أسئلة حول أداء نموذج الذكاء الاصطناعي الجديد Open Source AI Leader Reflection 70B، والذي وُجهت له اتهامات بـ "الاحتيال".

Home أخبار الذكاء الاصطناعي تطرح أسئلة حول أداء نموذج الذكاء الاصطناعي الجديد Open Source AI Leader Reflection 70B، والذي وُجهت له اتهامات بـ "الاحتيال".

Updated on سبتمبر 8 2024

في عطلة نهاية أسبوع واحدة فقط، واجه المتسابق الجديد في نماذج الذكاء الاصطناعي مفتوح المصدر تدقيقًا كبيرًا، مما أثار الشكوك حول سمعته. نموذج Reflection 70B، وهو نسخة من نموذج لاما 3.1 الضخم الذي أصدرته شركة ميتا، تم إطلاقه بواسطة شركة هايبرايت، التي كانت تعرف سابقًا باسم OthersideAI، وقد تم الإشادة به لتحقيقه معايير مثيرة للإعجاب. ومع ذلك، أثارت التقييمات اللاحقة من قبل مختبرين مستقلين تساؤلات حول صحة هذه الادعاءات.

في 6 سبتمبر 2024، أعلن مات شومر، المؤسس المشارك لشركة هايبرايت، عبر منصة التواصل الاجتماعي X، أن نموذج Reflection 70B هو "الأعلى في العالم بين نماذج المصدر المفتوح". وقد أوضح شومر استخدام النموذج لتقنية "ضبط الانعكاس"، التي تمكّن نماذج اللغة الكبيرة من التحقق من دقة outputs قبل تقديمها للمستخدمين، مما يعزز الأداء في مجالات متعددة.

ومع ذلك، بحلول 7 سبتمبر، تحدت منظمة تُدعى Artificial Analysis هذا الادعاء علنًا. واستند تحليلهم إلى أن نموذج Reflection 70B حقق نفس درجة MMLU كنموذج لاما 3 70B، ولكنه كان أدنى بكثير مقارنة بنموذج لاما 3.1 70B من ميتا، مما خلق تباينًا واضحًا مع نتائج هايبرايت الأولية.

اعترف شومر لاحقًا أن أوزان النموذج تعرضت لمشاكل خلال عملية التحميل إلى منصة Hugging Face، مما قد يفسر الفروقات في الأداء مقارنة بالاختبارات الداخلية.

في 8 سبتمبر، بعد اختبار واجهة برمجة تطبيقات خاصة، اعترفت منظمة Artificial Analysis بأنها لاحظت نتائج مثيرة للإعجاب لكنها غير مؤكدة، لم تلبِ ادعاءات هايبرايت الأصلية. كما طرحت أسئلة حرجة حول إصدار نسخة غير مختبرة من النموذج وغياب أوزان النموذج المنشورة لنسخة واجهة برمجة التطبيقات الخاصة.

عبر أعضاء المجتمع في منتديات Reddit المعنية بالذكاء الاصطناعي عن شكوكهم أيضًا حول أداء Origins Reflection 70B. وزعم بعضهم أنه يبدو كنسخة من لاما 3 بدلاً من لاما 3.1 المتوقع، مما أثار مزيدًا من الشكوك حول شرعيته. حتى اتهم أحد المستخدمين شومر بارتكاب "احتيال في مجتمع أبحاث الذكاء الاصطناعي".

رغم الانتقادات، دافع بعض المستخدمين عن Reflection 70B، مشيرين إلى أدائه القوي في حالات الاستخدام الخاصة بهم. ومع ذلك، يبرز الانتقال السريع من الحماس إلى النقد الطبيعة المتقلبة لمجال الذكاء الاصطناعي.

انتظر مجتمع أبحاث الذكاء الاصطناعي لمدة 48 ساعة تحديثات من شومر حول أداء النموذج وأوزانه المصححة. وفي 10 سبتمبر، أخيرًا تناول الجدل قائلًا: "تسرعت في هذا الإعلان، وأعتذر. اتخذنا قرارات بناءً على المعلومات المتاحة لدينا. أعلم أن الكثيرين متحمسون لهذه الإمكانية لكنهم متشككون. يعمل فريق بجد للتأكد مما حدث. بمجرد وضوح المعلومات، سنكون شفافين مع المجتمع".

وأشار شومر إلى منشور من ساهيل تشودري، مؤسس Glaive AI، الذي أكد لبس الفهم حول ادعاءات النموذج وعلق على صعوبة إعادة إنتاج درجات المعايير.

قال تشودري: "أريد أن أaddress النقد المشروع. أحقق في الوضع وسأقدم ملخصًا شفافًا قريبًا. لم أقم بتشغيل نماذج من مزودين آخرين في أي وقت، وهدفي هو شرح الفروقات، بما في ذلك السلوكيات غير المتوقعة مثل تخطي بعض المصطلحات. لدي الكثير لاستكشافه فيما يتعلق بالمعايير وأقدر صبر المجتمع بينما أعيد بناء الثقة".

تظل الحالة غير حاسمة، مع استمرار الشكوك حول كل من Reflection 70B وادعاءاته داخل مجتمع الذكاء الاصطناعي مفتوح المصدر.

LightEval: أداة مفتوحة المصدر من Hugging Face لتعزيز المساءلة في الذكاء الاصطناعي

استعد لعصر من تقلبات أسعار وحدات معالجة الرسوميات غير المتوقعة

Most people like

LiteLLM

154.5K

LiteLLM هي مكتبة مفتوحة المصدر تهدف إلى تبسيط استدعاءات إكمال LLM والتضمين، مما يجعلها أكثر سهولة وكفاءة للمطورين.

إكمال LLM Large Language Models (LLMs)

Jam

648.3K

تعرف على "جام": أداة فعالة لتقارير الأخطاء تهدف إلى تسريع عملية الإبلاغ عن الأخطاء للمستخدمين. بفضل واجهتها سهلة الاستخدام، تجعل "جام" من السهل أكثر من أي وقت مضى للفرق تحديد المشكلات وتتبعها وحلها بفاعلية.

تقرير الأخطاء AI Testing & QA

Storywizard.ai

12.6K

اكتشف منصة متطورة تستخدم الذكاء الاصطناعي لتقديم تجارب تعليمية مصممة خصيصًا للأطفال.

منصة مدعومة بالذكاء الاصطناعي AI Story Writing

Trickle

8.8K

عزز تعاون الفريق من خلال حلول إدارة المعرفة المدفوعة بالذكاء الاصطناعي.

التعاون المدعوم بالذكاء الاصطناعي AI Product Description Generator

Find AI tools in YBX