في حدث إطلاق سلسلة Pixel 9 اليوم، كشفت Google عن خدمة Gemini Live، المتاحة مبدئيًا لمشتركي Gemini Advanced الناطقين باللغة الإنجليزية. تهدف هذه الخدمة المبتكرة إلى توفير تجربة تواصل طبيعية وسلسة.
تمثل Gemini Live تقدمًا ملحوظًا في تكنولوجيا الصوت الذكي الخاصة بـ Google. مع محرك صوت محسن، تهدف الخدمة إلى تقديم محادثات متعددة الأطراف متماسكة، عاطفية، وواقعية. تتنافس هذه الخدمة مباشرة مع وضع الصوت المتقدم الذي طرحته OpenAI مؤخرًا لـ ChatGPT، مما يعزز من تكنولوجيا المحادثة الصوتية الذكية.
وفقًا لـ Google، توفر Gemini Live تجربة محادثة جديدة على الهواتف المحمولة، مما يمكّن المستخدمين من إجراء حوارات سلسة مع Gemini. أثناء المحادثات، يمكن للمستخدمين مقاطعة Gemini بسهولة لطرح أسئلة متتابعة، وتعديل أسلوب حديثه في الوقت الحقيقي، والاستمتاع بتجربة تواصل أكثر طبيعية. بالإضافة إلى ذلك، تقدم Gemini Live عشرة أصوات جديدة طبيعية للاختيار من بينها، مما يعزز من تخصيص المحادثات.
كما عرض الحدث تطبيقات Gemini Live في المقابلات الوهمية، حيث يمكن للمستخدمين التفاعل مع مدير التوظيف (أو الذكاء الاصطناعي) للحصول على تعليقات حول مهاراتهم في الحديث ونصائح للتطوير. تعزز هذه الميزة من أداء المستخدمين في المقابلات وتظهر الإمكانيات الواسعة لتطبيقات Gemini Live.
من المهم ملاحظة أنه رغم التقدم الكبير الذي حققته Gemini Live في المحادثة الصوتية، إلا أنها لا تدعم حاليًا ميزات الإدخال المتعدد الأشكال. كانت Google قد عرضت سابقًا قدرة Gemini Live على التقاط البيئة والاستجابة لها عبر كاميرات الهواتف في مؤتمر I/O في مايو، لكن من المتوقع أن يتأخر هذا الوظيفة حتى "في وقت لاحق من هذا العام." تشير Google إلى أن دمج إدخال متعدد الأشكال سيزيد من قدرات تفاعل Gemini Live، مما يوفر تجربة ذكية وأكثر شمولاً.
مع تقديم خدمة Gemini Live، عززت Google ريادتها في مجال المحادثة الصوتية الذكية. ومع تقدم التكنولوجيا المستمرة، من المتوقع أن تقدم للمستخدمين المزيد من المفاجآت والوسائل الراحة.