إطلاق المعاينة العامة لـ Google Gemini 1.5 Pro: استكشاف ميزات جديدة للتعرف على الصوت

في حدث Google Next الأخير، أعلنت Google عن تحديث كبير لنموذج الذكاء الاصطناعي Gemini 1.5 Pro، حيث زودته بقدرات معالجة صوتية غير مسبوقة. يمكن الآن لـ Gemini 1.5 Pro تفسير وتحليل الملفات الصوتية التي تم تحميلها مباشرة، واستخراج معلومات قيمة من مكالمات الأرباح أو الصوت في الفيديو دون الحاجة إلى نصوص مكتوبة.

من أبرز معالم هذا التحديث أن Gemini 1.5 Pro قد تفوق على Gemini Ultra، الذي كان سابقًا الأكثر قوة في السلسلة، من حيث الأداء. وأشارت Google إلى أن هذا النموذج قادر على فهم الأوامر المعقدة دون الحاجة إلى ضبط دقيق، مما يمثل تقدمًا كبيرًا في تكنولوجيا الذكاء الاصطناعي.

من المهم ملاحظة أن الوصول إلى Gemini 1.5 Pro يقتصر على المستخدمين الذين يمتلكون قدرات في Vertex AI وAI Studio. يتفاعل معظم المستخدمين مع نماذج لغة Gemini من خلال دردشة Gemini، بينما تدعم Gemini Ultra الدردشات الأكثر تطورًا. على الرغم من قوة Gemini Ultra، إلا أنها لا تضاهي سرعة Gemini 1.5 Pro.

بالإضافة إلى ذلك، كشفت Google عن تحديثات لنموذج طراز آخر للذكاء الاصطناعي، وهو Imagen 2. يعزز هذا النظام المتقدم لتحويل النص إلى صورة قدرات الصور لـ Gemini، مما يسمح الآن للمستخدمين بإضافة أو إزالة عناصر داخل الصور. كما قدمت Google ميزة SynthID، وهي علامة مائية رقمية لجميع الصور التي تم إنشاؤها باستخدام نموذج Imagen، تتضمن علامة غير مرئية تشير إلى مصدر الصور.

علاوة على ذلك، عرضت Google طريقة جديدة تدمج ردود الذكاء الاصطناعي مع بحث Google، مما يسمح له بتقديم إجابات استنادًا إلى معلومات في الوقت الحقيقي. وهذا يعني أن نماذج اللغة الكبيرة ستكون قادرة على تقديم بيانات حالية بدلاً من الاعتماد فقط على المعلومات المتاحة مسبقًا. ومع ذلك، قررت Google تقييد Gemini من الرد على الأسئلة المتعلقة بانتخابات الولايات المتحدة عام 2024، مما يعكس التزامها بالتعامل مع المعلومات الحساسة بمسؤولية.

يجدر بالذكر أن Gemini واجه انتقادات بسبب توليده لصور غير دقيقة لشخصيات تاريخية، مما يذكرنا أنه رغم التقدم في تكنولوجيا الذكاء الاصطناعي، لا يزال الحذر ضروريًا عند التعامل مع البيانات التاريخية والواقعية.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles