وضع الصوت المتقدم هو ميزة مبتكرة في ChatGPT تتيح للمستخدمين إجراء محادثات تفاعلية في الوقت الحقيقي مع الذكاء الاصطناعي، مما يلغي الحاجة إلى إدخال نصوص أو تبادلات صوتية طويلة. تم إطلاق هذه الميزة في نهاية يوليو لمجموعة مختارة من المشتركين في خدمة Plus، وتم عرضها لأول مرة خلال حدث تحديث الربيع من OpenAI.
تصف OpenAI وضع الصوت المتقدم بأنه يوفر "محادثات أكثر طبيعية وفي الوقت الحقيقي" ويمكّن المستخدمين من التداخل بسلاسة. كما أنه يستطيع الكشف عن مشاعر المستخدمين والاستجابة لها، ويمكنه أيضاً أخذ فترات توقف للتنفس وتقليد الضحك البشري أثناء المحادثات. إذا لم تتمكن من الوصول إلى الميزة بعد، فلا تقلق - سيتم طرحها للمزيد من المستخدمين قريباً.
مؤخراً، قدمت OpenAI بشكل رسمي ميزة الصوت المتقدم التي طال انتظارها لمجموعة محدودة من مشتركين ChatGPT Plus، مما يتيح لبعضهم استكشافها. على الرغم من أن حجم هذه المرحلة الأولية لا يزال غير واضح، إلا أن الشركة تعهدت بتوسيع الوصول في الأسابيع المقبلة، مع توقع توفرها الكامل لجميع المشتركين في Plus بحلول هذا الخريف. بينما يتطلع العديد من المستخدمين لتجربتها، يمكنك توقع الوصول في أي وقت قبل الشتاء، ما لم تحدث تأخيرات إضافية. ستعرف أنك قد حصلت على الوصول عندما تتلقى دعوة عبر البريد الإلكتروني أو إشعاراً في تطبيق ChatGPT.
لاستخدام وضع الصوت المتقدم، يتعين على المستخدمين أن يكون لديهم اشتراك في Plus وجهاز Android مع إصدار التطبيق 1.2024.206 أو أحدث، أو iPhone يعمل بنظام iOS 16.4 أو أحدث مع نفس إصدار التطبيق. من المهم ملاحظة أن وجود الجهاز الصحيح لا يضمن المشاركة في مرحلة الإصدار الأولية. لم تكشف OpenAI عن المعايير الخاصة باختيار المستخدمين لهذه الميزة، لكن الأفراد المختارين سيتلقون كلاً من إشعار عبر البريد الإلكتروني وتلميحاً في تطبيق ChatGPT المحمول للوصول إلى الوضع الجديد.
خلال المرحلة الأولية، ستجمع OpenAI مقاطع صوتية من المحادثات باستخدام وضع الصوت المتقدم لتحسين نماذجها، وذلك ما لم يختر المستخدمون إيقاف المشاركة في مشاركة البيانات. لتعطيل هذه الخيار، انتقل إلى علامة تبويب التحكم في البيانات في إعدادات التطبيق الخاص بك وألغِ تحديد "تحسين الصوت للجميع".
ذكرت OpenAI أن كلا من الإدخال والإخراج لوضع الصوت المتقدم لهما حدود للاستخدام اليومي، على الرغم من عدم الكشف عن المدد المحددة، وقد تتغير هذه الحدود بمرور الوقت. ومع ذلك، أظهر مستخدمون مثل Himels Tech محادثات استمرت تقريبا 10 دقائق. سيقوم الذكاء الاصطناعي بإخطار المستخدمين عندما يتبقى ثلاث دقائق، ليُنهي المحادثة ويعود إلى واجهة الصوت القياسية.
في جوهره، يوفر وضع الصوت المتقدم طريقة جديدة للتفاعل مع نموذج اللغة الكبير GPT-4، مما يمكّن المستخدمين من استخدامه لمهام متنوعة. بعبارة أخرى، أي شيء يمكن إنجازه باستخدام ChatGPT المستند إلى النص ممكن باستخدام الصوت المتقدم، معززاً بميزاته الصوتية الممتعة. يستكشف المستخدمون الأوائل إمكانياته، بدءاً من التدبيج الصوتي إلى سرد القصص والعد السريع.
ومع ذلك، هناك تدابير أمان وقيود مفروضة على وضع الصوت المتقدم. لا يمكن للمستخدمين إنشاء ذاكريات، أو استخدام التعليمات المخصصة، أو الوصول إلى GPTs في هذا الوضع. على الرغم من أنه يمكنه تذكر تفاصيل من محادثات سابقة باستخدام الصوت المتقدم، إلا أنه لا يستطيع الإشارة إلى المحادثات السابقة التي تمت عبر إدخالات نصية أو واجهة الصوت القياسية.
بالإضافة إلى ذلك، لن يؤدي وضع الصوت المتقدم الغناء، بغض النظر عن الطلبات. وفقاً لـ OpenAI، "احتراماً لحقوق المبدعين، قمنا بتنفيذ عدة تدابير، بما في ذلك فلاتر جديدة، لمنع وضع الصوت المتقدم من إنتاج محتوى موسيقي مثل الغناء."