يبدو أن OpenAI تتخذ خطوات نشطة لمعالجة القضايا المتعلقة بنماذج لغة GPT بعد الانتقادات التي تشير إلى أن GPT-4 أصبح "كسولاً" و"غبياً" ويعاني من أخطاء غير متوقعة، خاصة ما لوحظ على وسائل التواصل الاجتماعي في أواخر نوفمبر.
تزايدت التكهنات حول إمكانية تقديم GPT-4.5 بهدوء لبعض المستخدمين، كما تم الإيحاء ببعض ردود ChatGPT. بغض النظر عن صحة هذه النظرية، هناك مؤشرات على تحسينات داخلية ملحوظة في GPT-4 خلال الأسابيع الأخيرة.
منذ يوم الخميس الماضي، بدأ المستخدمون بالإبلاغ عن تحسينات في أداء GPT-4. وقد أشار البروفيسور إيثان مولك من جامعة وارتون، الذي كان قد لاحظ انخفاضاً في قدرات GPT-4 في نوفمبر، إلى تحسن كبير في كفاءة النموذج وجودة استجاباته، على الرغم من عدم وجود دليل على الانتقال إلى GPT-4.5. بعد اعتماده على مفسر الأكواد لتصحيح الأخطاء، وصف الفرق بأنه "الليل والنهار"، مما يتناقض تماماً مع تجاربه السابقة مع GPT-4 الذي كان "غير موثوق به ومملًا لأسابيع عدة".
في نفس الوقت، أعادت OpenAI فتح اشتراكات ChatGPT Plus يوم الأربعاء الماضي، بعد وقف التسجيلات منذ 14 نوفمبر. وفي منشور له على X، اعترف ألتمن بصبر المستخدمين خلال استقطاب وحدات GPU إضافية.
بينما غير مؤكدة إن كان هناك رابط مباشر بين إعادة فتح تسجيلات ChatGPT Plus والتحسينات في GPT-4، فإن التوقيت لافت. فقد توقفت التسجيلات بعد فترة قصيرة من يوم طلبات التطوير الأول لـ OpenAI، الذي قدم العديد من الميزات الجديدة للإصدار المدفوع من الدردشة الذكية. ولم يكن الاشتراك في ChatGPT Plus مفتوحاً بسبب الضغط الكبير على قدرة معالجته بعد يوم المطورين.
قدمت شكاوى المستخدمين سابقًا مشكلات مع GPT-4، حيث كان يوفر تفسيرات حول كيفية تنفيذ الأوامر بدلاً من تنفيذ المهام. وبعد هذه الشكاوى، ظهرت تقارير عن سلوك غير معتاد لـ GPT-4، مختلف عن الاستخدامات التقليدية للمستخدمين. ومن القضايا المتكررة كانت "رد الكلام" من GPT-4 أو الحاجة لعدة توضيحات قبل تنفيذ الطلبات. ومن الشكاوى الشائعة الأخرى كانت ميله لشرح الأوامر بدلاً من إتمامها.
يمكن تتبع تراجع أداء GPT-4 إلى يوليو على الأقل، حيث أشارت دراسة إلى انخفاض كبير في الدقة بين مارس ويونيو. وقد اقترح العديد، من بينهم بيتر ويليندر، نائب رئيس المنتج في OpenAI، أن النقائص المزعومة في جودة الإيجابات قد تكون نتيجة آثار نفسية أثناء تحديث النموذج. اقترح بعض المستخدمين تعديل استفساراتهم لتحقيق نتائج أفضل.
على الرغم من أن OpenAI بقيت هادئة نسبيًا بشأن تطوراتها الداخلية، فإن منشور ألتمن حول وحدات GPU يشير على الأرجح إلى تغييرات جارية وراء الكواليس. وقد أشارت تقارير في أبريل إلى أن OpenAI ستحتاج لأكثر من 30,000 وحدة GPU للحفاظ على أدائها التجاري خلال بقية 2023، حتى قبل الزيادة في الاهتمام الملحوظ في نوفمبر.
تزايدت التكهنات حول GPT-4.5، مدفوعة بتسريبات تفصيلية حول إصدار جديد محتمل. شارك روان تشيونغ، مؤسس النشرة الإخبارية @therundownai، معلومات عن الأسعار والقدرات المتعددة الأنماط المرتبطة بهذا التطور على X. عندما استفسر تشيونغ حول صحة هذه التفاصيل، رد ألتمن ببساطة "لا".
بدأت التكهنات حول GPT-4.5 بصورة مزعومة تظهر ميزات النموذج الجديد والأسعار. ومع ذلك، فقد رفض ألتمن الشائعات باعتبارها غير صحيحة. ومع ذلك، يصر بعض المستخدمين الذين يعتقدون أنهم شهدوا التحديث المقترح على أنهم يختبرون GPT-4.5، مشيرين إلى أداء متفوق. حتى أن بعضهم استفسر عن نموذج الدردشة، فتلقوا ردودًا مثل "GPT-4.5 Turbo". وقد أدى ذلك إلى نظريات مفادها أن OpenAI قد تكون تختبر GPT-4.5 بشكل رئيسي من خلال تطبيقاتها المحمولة. ومع ذلك، لا يمكن لجميع المستخدمين تكرار هذه النتائج، وغالبًا ما يُقال لهم إنهم يستخدمون GPT-4 العادي. أشار موظف OpenAI ويل ديبيو إلى التباينات بأنها "هلوسة غريبة وغير منتظمة".
أشار تشيونغ إلى منشور من الصفحة الرسمية لـ ChatGPT على X تحتوي على رموز تعبيرية depicting brain وclouds، والتي يفسرها كاعتراف غير مباشر من OpenAI بظاهرة الهلوسة. ومن الجدير بالذكر أن OpenAI توفر الوصول المبكر للمستخدمين المدفوعين، بما في ذلك ChatGPT Plus، ومستخدمي API المطورين، والعملاء المؤسسيين. نظرًا لأن هؤلاء المستخدمين غالباً ما يكونون الأوائل في اختبار الإصدارات الجديدة من GPT والميزات، فإن الذين يجربون أداء النموذج يمتلكون على الأرجح نوعًا من وصول API للمطور.
حتى إذا كانت OpenAI تختبر حاليًا GPT-4.5، فإن الجدول الزمني لأي تحديثات رسمية لا يزال غير واضح، خاصة بينما تستقر الشركة بعد التحديات التنظيمية الأخيرة. مع استمرار تطور المنتج، فإنه يظهر أن أي "إصدار" من ChatGPT المستخدم قد يكون أقل أهمية من التحسينات الملموسة التي يتم تحقيقها.