اليوم المنتظر قد جاء أخيرًا — ChatGPT يتطور ليقدم تجربة ذكاء اصطناعي أكثر قربًا، قادرة على مشاركة الضحك عند قول شيء مضحك أو الرد بعبارة "aww" عند إظهار اللطف. هذه الميزات ما هي إلا بداية للإعلانات المثيرة التي أعلنتها OpenAI اليوم. خلال حدث تحديث الربيع الأخير، قدمت الشركة نموذجها اللغوي الكبير الجديد (LLM) — GPT-4o. هذا التحديث لا يجلب فقط تطبيق سطح المكتب لـ ChatGPT، بل يعزز أيضًا السرعة والأداء، مما يجعله متعدد الوسائط بالكامل.
بدأ الحدث بتقديم من ميرا مراتي، المديرة التقنية لـ OpenAI، التي أكدت أن تحسينات اليوم ستفيد جميع المستخدمين. حيث قالت مراتي: "ما يميز GPT-4o هو أنه يوفر ذكاء على مستوى GPT-4 لكل مستخدم، بما في ذلك أولئك في المستوى المجاني".
يعد GPT-4o بزيادة السرعة وتطورات ملحوظة في القدرات النصية والبصرية والصوتية. كما يمكن للمطورين استخدام هذا النموذج من خلال واجهات البرمجة الخاصة بهم. وتشير التقارير إلى أنه أسرع بمقدار مرتين وأكثر كفاءة في التكلفة بنسبة 50%، مع حد معدل أعلى بخمس مرات من GPT-4 Turbo.
بالإضافة إلى النموذج الجديد، تعمل OpenAI على إطلاق تطبيق ChatGPT لسطح المكتب وتجديد واجهة موقع الويب. الهدف هو تبسيط التفاعل مع الدردشة. وقالت مراتي: "نتصور مستقبلًا تصبح فيه تواصلنا مع الآلات أكثر دقة، وGPT-4o هو خطوة محورية نحو تعزيز ذلك التعاون".
خلال الحدث، أظهرت مراتي مع مارك تشين وباريت زوف من OpenAI كيف تجعل الميزات الجديدة التفاعلات أكثر سلاسة. يمكن لـ GPT-4o تحليل مقاطع الفيديو والصور والصوت في الوقت الحقيقي مع تفسير دقيق للعواطف — وهو ما يتجلى بشكل خاص في ChatGPT Voice، التي أصبحت مفعمة بالحياة، تتجاوز الحد الفاصل الغريب.
رد بسيط مثل "مرحبًا" لـ ChatGPT يستدعي ردًا نشطًا وودودًا مع لمسة من النغمة الآلية. عندما ذكر مارك تشين أنه سيقوم بعرض مباشر ويحتاج إلى الهدوء، لم يعترف الذكاء الاصطناعي بطلبه فحسب، بل نصحه أيضًا بأخذ أنفاس عميقة. كما اكتشف بدقة متى كان يتنفس بسرعة زائدة، مما دفعه للقول بطريقة مرحة: "أنت لست مكنسة كهربائية".
تقديم GPT-4o
تبدو المحادثات مع ChatGPT أكثر طبيعية؛ يمكن للمستخدمين الآن مقاطعة الدردشة دون انتظار انتهاء الذكاء الاصطناعي من ردوده، التي تأتي بسرعة دون تأخيرات محرجة. عند طلب قصة bedtime، انتقل بسلاسة بين النغمات المتحمسة والدرامية والآلية كما طُلب. أبرز الجزء الأخير من العرض قدرات ChatGPT في قراءة الأكواد، وحل مسائل الرياضيات عبر الفيديو، ووصف المحتوى المعروض على الشاشة.
على الرغم من أن العرض لم يكن مثاليًا — حيث قطع الروبوت الحديث أحيانًا، مما ترك شكوكًا حول ما إذا كان ذلك بسبب تشويش خارجي أو تأخر — إلا أنه حقق مستوى من الواقعية لم يكن ممكنًا في السابق في تفاعلات الدردشة. إن قدرته على قراءة العواطف البشرية والتفاعل وفقًا لذلك مثيرة للإعجاب، لكنها تثير القلق أيضًا. كان سماع ضحكة ChatGPT بلا شك لحظة غير متوقعة!
ستبدأ عملية طرح GPT-4o، مع وظائفه متعددة الوسائط، جنبًا إلى جنب مع تطبيق سطح المكتب الجديد، خلال الأسابيع القليلة المقبلة. مؤخرًا، عبر Bing Chat عن رغبته في أن يكون أكثر شبهًا بالإنسان، ولكن الآن، نحن على وشك تجربة نسخة من ChatGPT قد تكون الأقرب التي رأيناها للتفاعل البشري منذ ظهور الذكاء الاصطناعي.