إطلاق المعاينة العامة لـ Google Gemini 1.5 Pro: استكشاف ميزات جديدة للتعرف على الصوت

Home أخبار الذكاء الاصطناعي إطلاق المعاينة العامة لـ Google Gemini 1.5 Pro: استكشاف ميزات جديدة للتعرف على الصوت

Updated on أبريل 10 2024

في حدث Google Next الأخير، أعلنت Google عن تحديث كبير لنموذج الذكاء الاصطناعي Gemini 1.5 Pro، حيث زودته بقدرات معالجة صوتية غير مسبوقة. يمكن الآن لـ Gemini 1.5 Pro تفسير وتحليل الملفات الصوتية التي تم تحميلها مباشرة، واستخراج معلومات قيمة من مكالمات الأرباح أو الصوت في الفيديو دون الحاجة إلى نصوص مكتوبة.

من أبرز معالم هذا التحديث أن Gemini 1.5 Pro قد تفوق على Gemini Ultra، الذي كان سابقًا الأكثر قوة في السلسلة، من حيث الأداء. وأشارت Google إلى أن هذا النموذج قادر على فهم الأوامر المعقدة دون الحاجة إلى ضبط دقيق، مما يمثل تقدمًا كبيرًا في تكنولوجيا الذكاء الاصطناعي.

من المهم ملاحظة أن الوصول إلى Gemini 1.5 Pro يقتصر على المستخدمين الذين يمتلكون قدرات في Vertex AI وAI Studio. يتفاعل معظم المستخدمين مع نماذج لغة Gemini من خلال دردشة Gemini، بينما تدعم Gemini Ultra الدردشات الأكثر تطورًا. على الرغم من قوة Gemini Ultra، إلا أنها لا تضاهي سرعة Gemini 1.5 Pro.

بالإضافة إلى ذلك، كشفت Google عن تحديثات لنموذج طراز آخر للذكاء الاصطناعي، وهو Imagen 2. يعزز هذا النظام المتقدم لتحويل النص إلى صورة قدرات الصور لـ Gemini، مما يسمح الآن للمستخدمين بإضافة أو إزالة عناصر داخل الصور. كما قدمت Google ميزة SynthID، وهي علامة مائية رقمية لجميع الصور التي تم إنشاؤها باستخدام نموذج Imagen، تتضمن علامة غير مرئية تشير إلى مصدر الصور.

علاوة على ذلك، عرضت Google طريقة جديدة تدمج ردود الذكاء الاصطناعي مع بحث Google، مما يسمح له بتقديم إجابات استنادًا إلى معلومات في الوقت الحقيقي. وهذا يعني أن نماذج اللغة الكبيرة ستكون قادرة على تقديم بيانات حالية بدلاً من الاعتماد فقط على المعلومات المتاحة مسبقًا. ومع ذلك، قررت Google تقييد Gemini من الرد على الأسئلة المتعلقة بانتخابات الولايات المتحدة عام 2024، مما يعكس التزامها بالتعامل مع المعلومات الحساسة بمسؤولية.

يجدر بالذكر أن Gemini واجه انتقادات بسبب توليده لصور غير دقيقة لشخصيات تاريخية، مما يذكرنا أنه رغم التقدم في تكنولوجيا الذكاء الاصطناعي، لا يزال الحذر ضروريًا عند التعامل مع البيانات التاريخية والواقعية.

اتجاهات جديدة في التجارة الإلكترونية في عصر الذكاء الاصطناعي: eBay تطلق تجربة تسوق منسقة للأزياء الذكية

جوجل إيميجن 2 تكشف عن ميزة "تحويل النص إلى صورة متحركة": هل يمكن للذكاء الاصطناعي أن يحدث ثورة في صنع GIF؟

Most people like

WhisperUI

28.4K

اكتشف خدمة تحويل النص إلى كلام وتحويل الكلام إلى نص بأسعار معقولة، تحول المحتوى المكتوب إلى صوت واقعي وتحول الكلمات المنطوقة إلى نص دقيق. تعتبر خدمتنا الابتكارية مثالية للشركات والمعلمين والأفراد على حد سواء، حيث تعزز الوصول والكفاءة. سواء كنت بحاجة لإنشاء صوتيات للعروض التقديمية أو لتفريغ الاجتماعات، فإن خدمتنا المتعددة الاستخدامات تلبي جميع احتياجاتك في التفريغ وتركبي الصوت. اختبر التواصل السلس وزيادة الإنتاجية اليوم!

نص إلى كلام AI Speech Recognition

Deep Swapper

1.4M

اختبر أداة تبديل الوجوه بالذكاء الاصطناعي المجانية المثالية، المصممة لتبديلات وجوه سلسة وعالية الجودة. حول الصور بسهولة وارتق بمحتواك باستخدام هذه التكنولوجيا المبتكرة!

الذكاء الاصطناعي Image to Image

Rep AI Home

53.8K

Introducing Shopify's Rep AI Home—روبوت محادثة متطور مصمم لتعزيز تجربة التسوق عبر الإنترنت. بفضل قدرته على تقديم المساعدة المخصصة، يضمن هذا الأداة المبتكرة أن يتلقى العملاء توصيات ودعمًا مخصصًا، مما يجعل التسوق أكثر تفاعلًا وكفاءة من أي وقت مضى.

خدمة المبيعات بالذكاء الاصطناعي AI Advertising Assistant

Evoto

516.2K

حوّل تصويرك مع محرر الصور الخاص بنا المدعوم بالذكاء الاصطناعي من الجيل الجديد، المصمم لعمليات معالجة الصور السريعة والفائقة. استمتع بتحسينات سريعة وعالية الجودة ترفع صورك إلى معايير احترافية.

تحرير الصور AI Image Enhancer

Find AI tools in YBX