أوبن إي أي تكشف النقاب عن نموذج الاستدلال o1: يتفوق على GPT-4 بقدرات تعادل مستوى الدكتوراه البشرية في الفيزياء وعلم الأحياء.

مؤخراً، قدمت OpenAI نموذجها الأحدث "ستروبري"، المعروف بـ "o1". تم تصميم هذه السلسلة الجديدة من نماذج الذكاء الاصطناعي للقيام بتفكير أعمق قبل الإجابة على الأسئلة.

بالمقارنة مع النماذج السابقة التي كانت تركز على العلوم، البرمجة، والرياضيات، يتفوق نموذج o1 في المهام العقلية المعقدة والتعامل مع المشاكل الأكثر تحدياً. من خلال التدريب المحسن، لا يقوم نموذج o1 فقط بتحسين عمليات التفكير، بل يستكشف استراتيجيات متنوعة ويمتلك قدرات تصحيح ذاتي.

تشير تقييمات OpenAI إلى أن نموذج o1 يؤدي بمستوى دكتوراه في الاختبارات المرجعية في الفيزياء والكيمياء وعلم الأحياء. في الرياضيات والبرمجة، يبرز o1 أيضاً: خلال امتحان التأهل للأولمبياد الدولي للرياضيات (IMO)، أجاب النموذج السابق GPT-4o على 13% فقط من الأسئلة بشكل صحيح، بينما حقق نموذج o1 معدل دقة مذهل بلغ 83%. بالإضافة إلى ذلك، حصل o1 على المرتبة 89 في مسابقات Codeforces، مما يبرز موهبة برمجية استثنائية.

على الرغم من أن o1 لا يزال يفتقر إلى بعض الميزات العملية لـ ChatGPT، مثل تصفح الويب وتحميل الملفات، إلا أن OpenAI تُبرز قدرة o1 الخاصة في حل المشاكل العلمية والرياضية المعقدة. يمكن للباحثين الطبيين الاستفادة من o1 لتحليل بيانات تسلسل الخلايا، ويمكن للفيزيائيين إنشاء معادلات رياضية معقدة للبصريات الكمية، بينما يمكن للمطورين استخدام o1 لإنشاء سير عمل متعددة الخطوات.

كما أطلقت OpenAI o1-mini، وهو نموذج تفكير أسرع وأكثر تكلفة، مثالي لتطبيقات البرمجة. يعد سعر o1-mini 80% أقل من o1، مما يجعله خياراً اقتصادياً للمواقف التي تتطلب التفكير دون معرفة كبيرة بالعالم.

فيما يتعلق بالسلامة، قدمت OpenAI نهج تدريب جديد يستفيد من قدرات التفكير في نموذج o1 لتعزيز الامتثال لمعايير السلامة والتوافق. في اختبارات الهروب، حصل o1-preview على 84، مقارنةً بـ 22 لنموذج GPT-4o، مما يُظهر تحسينات كبيرة في الحفاظ على السلامة.

حالياً، تتوفر النسخ التجريبية من o1 وo1-mini في ChatGPT (Plus وTeam) ومن خلال واجهة API، مع خطط لجعل o1-mini متاحاً لجميع مستخدمي ChatGPT المجانيين في المستقبل.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles