أطلقت OpenAI نموذج GPT-4o مجانًا وChatGPT لمستخدمي سطح المكتب.

اليوم في حدث تحديثات الربيع في OpenAI، كشفت المديرة التقنية ميرا موراتي عن GPT-4o (GPT-4 أومني)، وهو نموذج لغوي كبير متعدد الوسائط مبتكر سيتاح لمستخدمي ChatGPT المجانيين في الأسابيع المقبلة. بالإضافة إلى ذلك، سيتم إطلاق تطبيق ChatGPT جديد لسطح المكتب لنظام macOS (بينما سيأتي دعم Windows لاحقًا) مما سيمكن المستخدمين من الوصول إلى المنصة خارج تطبيقات الويب والهواتف المحمولة.

وقالت موراتي: "يستطيع GPT-4o التحليل عبر الصوت والنص والرؤية"، مشيرة إلى قدرته على استقبال وتحليل مقاطع الفيديو الحية التي يلتقطها المستخدمون عبر تطبيق ChatGPT على هواتفهم الذكية، على الرغم من أن هذه الميزة ليست متاحة للجمهور بعد.

وأضافت: "هذا يبدو سحريًا، وهو أمر رائع، لكننا نريد إزالة الغموض والسماح لكم بتجربته بأنفسكم".

يمكن للنموذج الجديد الاستجابة بصوت في الوقت الحقيقي، واكتشاف الحالات العاطفية للمستخدمين من المدخلات الصوتية والمرئية، وضبط نغمة صوته للتعبير عن مشاعر متنوعة، مشابهًا لما تقدمه شركة Hume الناشئة في الذكاء الاصطناعي.

خلال عرض تجريبي، طلب أحد المقدمين من ChatGPT المدعوم بـ GPT-4o سرد قصة بزيادة الدراما، وقد نفذ ذلك بسرعة. ويتوقف عن الكلام بذكاء عند مقاطعته ويستمع بانتباه قبل أن يستأنف.

شاركت OpenAI مقاطع فيديو عرض توضح قدرات GPT-4o، قائلة إنه يمكنه الاستجابة للمدخلات الصوتية في غضون 232 مللي ثانية، بمتوسط 320 مللي ثانية، مما يجعلهComparable مع أوقات استجابة المحادثة البشرية.

توضحت OpenAI كيف يعزز GPT-4o تجربة المستخدم، قائلة: "قبل GPT-4o، كانت أوضاع الصوت تعاني من تأخيرات تبلغ 2.8 ثانية (GPT-3.5) و5.4 ثانية (GPT-4)، باستخدام ثلاثة نماذج منفصلة. هذا يعني أن مصدر الذكاء الرئيسي — GPT-4 — لم يكن قادرًا على إدراك النغمة أو المتحدثين المتعددين أو الأصوات الخلفية بشكل كامل".

مع GPT-4o، تتم معالجة جميع المدخلات والمخرجات بواسطة شبكة عصبية واحدة، تجمع بين النص والرؤية والصوت لتوفير تفاعلات أغنى. يمكنه أيضًا إنشاء رؤى متعددة لصورة معينة يمكن تحويلها إلى كائنات ثلاثية الأبعاد.

ومع ذلك، لم تعلن OpenAI عن خطط لجعل GPT-4o مفتوح المصدر أو أي من نماذجها الجديدة. بينما يمكن للمستخدمين استكشاف قدرات النموذج على موقع OpenAI وعبر واجهة برمجة التطبيقات، لن تتاح لهم الوصول إلى أوزان النموذج الأساسية للتخصيص، وهي نقطة انتقاد من الشريك المؤسس إيلون ماسك.

يمثل طرح GPT-4o تحديثًا كبيرًا لتجربة ChatGPT المجاني. بعد أن كان محدودًا بالنموذج النصي فقط GPT-3.5، سيتمكن المستخدمون المجانيون الآن من الوصول إلى نموذج أكثر تقدمًا مع قدرات محسنة لتحليل الصور والمستندات، وتصفح الويب، وتحليل البيانات، وإنشاء GPTs مخصصة، وذاكرة تحتفظ بتفضيلات المستخدم من خلال مطالبات بسيطة.

في عرض مباشر، عرض المقدمون ChatGPT المدعوم بـ GPT-4o وهو يقوم بترجمة الكلمات المنطوقة في الوقت الحقيقي بين الإيطالية والإنجليزية.

كما أكدت OpenAI أن "ChatGPT يدعم الآن أكثر من 50 لغة للتسجيل وتسجيل الدخول وإعدادات المستخدم". علاوة على ذلك، يتميز GPT-4o بفهم الصور المشتركة ومناقشتها، ويمكنه إنشاء شخصيات فنية متسقة باستخدام الذكاء الاصطناعي، وهو إنجاز لم تنجح العديد من مولدات الفن القائمة على الذكاء الاصطناعي في تحقيقه.

في البداية، سيكون GPT-4o متاحًا للمشتركين المدفوعين، مع طرح تدريجي للمستخدمين المجانيين: "سنبدأ بمستخدمي ChatGPT Plus وTeam، مع الوصول الخاص Enterprise قريبًا. سيكون للمستخدمين المجانيين حدود استخدام"، حسبما قالت OpenAI.

على وسائل التواصل الاجتماعي، أكدت OpenAI أنه يتم طرح "مدخلات النص والصورة" في واجهة برمجة التطبيقات اليوم، بينما ستطلق القدرات الصوتية والمرئية في الأسابيع المقبلة. ستقدم واجهة برمجة التطبيقات GPT-4o بنصف سعر وبضعف سرعة GPT-4 Turbo، مع زيادة حدود المكالمات للمطورين من الأطراف الثالثة.

وتحدث الرئيس التنفيذي لشركة OpenAI سام التمان عن تطور مهمة الشركة: "كان هدفنا إنشاء ذكاء اصطناعي لصالح المجتمع، ولكن يبدو الآن أننا سنطور ذكاءً اصطناعيًا يمكّن الآخرين من الابتكار، مما يعود بالنفع على الجميع".

في منشوره على المدونة، أشار التمان إلى: "مهمتنا الأساسية هي تقديم أدوات الذكاء الاصطناعي القوية بتكلفة معقولة. أنا فخور بأننا نقدم أفضل نموذج عالميًا مجانًا عبر ChatGPT".

من المقرر طرح تطبيق ChatGPT الجديد لسطح المكتب على مراحل، حيث سيصدر أولاً لنظام macOS ثم لنظام Windows. وكشفت موراتي أن أكثر من 100 مليون شخص يستخدمون ChatGPT حاليًا، مع إنشاء أكثر من مليون GPT مخصصة.

على الرغم من أن الحدث استغرق 26 دقيقة فقط وبعض العروض المباشرة الصعبة، فإن التكنولوجيا التي ستُطلق قريبًا تعد بتحسين تجربة المستخدم، مقدمة واجهة أكثر سلاسة وقوة من النسخ السابقة.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles