اكتشف نموذج "Reflection 70B" من هايبررايت: أقوى نموذج ذكاء صناعي مفتوح المصدر في العالم.

لم تتمكن التقييمات الخارجية من تكرار مؤشرات الأداء التي سبق وشاركها مات شومر، المؤسس المشارك والرئيس التنفيذي لشركة AI HyperWrite، فيما يتعلق بنموذج Reflection 70B. نتيجة لذلك، يواجه شومر اتهامات بالاحتيال على منصة X.

ظهر منافس جديد في عالم الذكاء الاصطناعي: حيث أعلن شومر عن نموذج Reflection 70B، وهو نموذج لغوي كبير يعتمد على نموذج Meta مفتوح المصدر Llama 3.1-70B Instruct. يتضمن هذا النموذج تقنية مبتكرة لتصحيح الأخطاء ذاتيًا، مما يظهر أداءً مثيرًا في اختبارات الأداء من جهات خارجية.

في منشور على X، أعلن شومر أن Reflection 70B هو "أفضل نموذج ذكاء اصطناعي مفتوح المصدر في العالم." وشارك مخططًا لأداء النموذج، الذي يبرز نتائجه المتفوقة.

اختبارات دقيقة وأداء متميز

مرت Reflection 70B باختبارات شاملة باستخدام مقاييس مثل MMLU وHumanEval، حيث ضمنت أداة Decontaminator من LMSys أن النتائج خالية من التلوث. تُظهر النتائج أن Reflection يتفوق باستمرار على نماذج سلسلة Llama من Meta ويتنافس عن كثب مع النماذج التجارية الرائدة.

يمكن للمستخدمين تجربة هذا النموذج مباشرة على موقع العرض التوضيحي. ومع ذلك، أشار شومر إلى أن الإعلان عن النموذج قد أثار حركة مرور كبيرة، وفريقه يعمل بسرعة على تأمين وحدات معالجة رسوميات إضافية لتلبية الطلب.

قدرات فريدة لنموذج Reflection 70B

أكد شومر أن نموذج Reflection 70B يقدم مزايا فريدة، خاصة في تحديد الأخطاء وتصحيحها. وذكر: "غالبًا ما تُعاني النماذج اللغوية الكبيرة من تضليل البيانات دون القدرة على تصحيح المسار. ماذا لو استطاع النموذج التعلم للتعرف على أخطائه وتصحيحها؟"

هذا الإدراك قاد إلى اسم "Reflection"، حيث يمكن للنموذج تقييم مخرجاته من حيث الدقة قبل عرضها على المستخدم. تكمن ميزته في "تعديل الانعكاسات"، وهي تقنية تسمح له بتحديد النقاط الضعيفة في reasoning وتصحيحها قبل إنهاء الرد.

يقدم Reflection 70B رموزًا خاصة للتفكير المنظم وتصحيح الأخطاء، مما يمكّن من التفاعل السلس مع المستخدم. أثناء الاستدلال، يوفر النموذج مخرجات reasoning ضمن علامات معينة، مما يسمح بإجراء تصحيحات في الوقت الحقيقي عند تحديد الأخطاء.

تشمل النسخة التجريبية اقتراحات للمهام، مثل حساب عدد حرف "r" في "ستروبري" وتحديد أي الأرقام أكبر، 9.11 أم 9.9—مهام تُخطئ فيها العديد من النماذج، بما في ذلك المعروفة بشهرتها. في اختباراتنا، قدم Reflection 70B الجواب الصحيح بعد تأخير قصير.

تجعل هذه الوظيفة النموذج ذا قيمة خاصة للمهام التي تتطلب دقة عالية، حيث يفصل reasoning إلى خطوات مميزة لتحسين الدقة. يتوفر Reflection 70B للتنزيل عبر Hugging Face، مع توقعات لوصول واجهة برمجة التطبيقات لاحقًا اليوم عبر Hyperbolic Labs.

ترقب نموذج Reflection 405B

صدور Reflection 70B هو مجرد البداية. أعلن شومر أن نموذجًا أكبر، Reflection 405B، سيطرح الأسبوع المقبل. كما ذكر أنه يجري جهودًا لتكامل Reflection 70B في منتج مساعد الكتابة الرئيسي من HyperWrite، قائلاً: "سأشارك المزيد عن هذا قريبًا."

يهدف Reflection 405B إلى تجاوز حتى أفضل النماذج المغلقة المصدر المتاحة حاليًا. أشار شومر أيضًا إلى أنه سيتم نشر تقرير مفصل عن عملية التدريب والمقاييس، مما يوفر رؤى حول الابتكارات وراء سلسلة Reflection.

مبني على نموذج Meta Llama 3.1-70B Instruct، يحافظ Reflection 70B على التوافق مع الأدوات والقنوات الحالية من خلال تنسيق محادثة Llama.

مساهمة البيانات الاصطناعية من Glaive

عامل حيوي في نجاح Reflection 70B هو البيانات الاصطناعية المولدة من Glaive، وهي شركة ناشئة تركز على إنشاء مجموعات بيانات محددة الاستخدام. تتيح منصة Glaive التدريب السريع لنماذج لغوية صغيرة مستهدفة، مما يعالج عنق الزجاجة الكبير في تطوير الذكاء الاصطناعي: توفر بيانات عالية الجودة ومخصصة للمهام.

من خلال إنتاج مجموعات بيانات اصطناعية مصممة وفقًا للاحتياجات المحددة، تتيح Glaive للشركات تحسين النماذج بكفاءة واقتصادية. وقد حققت الشركة نجاحًا سابقًا مع نماذج أصغر، مثل نموذج 3B الذي تفوق على نظيراتها الكبيرة مفتوحة المصدر في مهام مثل HumanEval. حصلت Glaive على استثمار تمويلي بقيمة 3.5 مليون دولار من Spark Capital دعمًا لرؤيتها المتعلقة ببيئة الذكاء الاصطناعي الديمقراطية.

من خلال الاستفادة من تكنولوجيا Glaive، أنتج فريق Reflection بيانات اصطناعية عالية الجودة، مما accélère تطوير المنتج بشكل كبير. وفقًا لشومر، استغرق عملية التدريب ثلاثة أسابيع، مع خمسة تكرارات للنموذج، باستخدام مجموعة بيانات مخصصة تم إنشاؤها باستخدام أنظمة Glaive.

خلفية HyperWrite

على الرغم من أن ظهور Reflection 70B قد يبدو مفاجئًا، إلا أن شومر كان متعمقًا في قطاع الذكاء الاصطناعي لسنوات. شارك في تأسيس ما كان يُطلق عليه في البداية Otherside AI في عام 2020 مع جايسون كوبرج في ميلفيل، نيويورك. حققت الشركة نجاحًا مع HyperWrite، منتجها الرائد، الذي تطور من ملحق Chrome لكتابة رسائل البريد الإلكتروني إلى مساعد كتابة AI شامل قادر على كتابة المقالات وتنظيم الرسائل. اعتبارًا من نوفمبر 2023، كان لدى HyperWrite مليونا مستخدم، مما منح مؤسسيها مكانًا في قائمة "30 تحت 30" في Forbes.

في مارس 2023، حصلت HyperWrite على 2.8 مليون دولار من مستثمرين، بما في ذلك Madrona Venture Group، مما مكنها من إدخال ميزات مبتكرة مدفوعة بالذكاء الاصطناعي تحول المتصفحات إلى مساعدين افتراضيين يتعاملون مع مهام متنوعة.

يؤكد شومر أن الدقة والسلامة تظل في مقدمة أولويات HyperWrite، خاصة مع تعمقها في الأتمتة المعقدة. يستمر المنصة في تحسين أداة المساعد الشخصي، مما يعكس نفس الرعاية للدقة والمسؤولية الموجودة في Reflection 70B.

آفاق مستقبلية لـ HyperWrite ونماذج Reflection

في المستقبل، يخطط شومر لتحقيق تقدم أكبر في سلسلة Reflection. مع الإطلاق الوشيك لـ Reflection 405B، يعتقد أنه سيتفوق بشكل كبير على أداء النماذج المملوكة مثل GPT-4o من OpenAI.

هذا يطرح تحديات ليس فقط لـ OpenAI، التي تسعى على ما يُزعم إلى استثمارات جديدة كبيرة من لاعبين رئيسيين مثل Nvidia وApple، ولكن أيضًا لمزودي النماذج المغلقة المصدر الآخرين مثل Anthropic وMicrosoft.

بينما يتطور مجال الذكاء الاصطناعي التوليدي، يتغير ميزان القوى مرة أخرى. يمثل ظهور Reflection 70B لحظة حاسمة للذكاء الاصطناعي المفتوح المصدر، مما يمنح المطورين والباحثين وصولًا إلى أداة قوية تنافس النماذج المملوكة. مع نهجها المبتكر في reasoning وتصحيح الأخطاء، قد تؤسس Reflection معيارًا جديدًا لقدرالات النماذج المفتوحة المصدر.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles