جوجل تكشف عن نموذج جنّي بـ 11 مليار معلمة: تحويل الصور إلى عوالم افتراضية قابلة للعب

قدمت فريق Google DeepMind مؤخرًا نموذج "جينى"، وهو نموذج أساسي عالمي يتضمن 11 مليار معلمة، قادر على تحويل صورة واحدة إلى عالم افتراضي تفاعلي. وقد نالت هذه التقنية الرائدة اهتمامًا كبيرًا، مما يمثل لحظة محورية لدخول الذكاء الاصطناعي عالم ألعاب الفيديو.

على عكس النماذج السابقة، يتعلم "جينى" من 200,000 ساعة من مقاطع الفيديو غير المصنفة على الإنترنت دون الحاجة إلى تدريب موجه، مما يمكّنه من توليد مشاهد غنية ومتنوعة. كما يمكنه تحديد الشخصيات الرئيسية في المشهد بدون أي تسميات للأفعال، مما يعزز من تفاعل المستخدم ويظهر إمكاناته الكبيرة في إنشاء بيئات افتراضية.

تتكون قدرات "جينى" من ثلاثة مكونات أساسية: نموذج الفعل الكامن، مُجزئ الفيديو، ونموذج الديناميكية التلقائية. تعمل هذه العناصر معًا لتطوير فضاء فعل كامن يُثري تفاعل المستخدم، بينما يمكّن الوكلاء من محاكاة سلوكيات غير مرئية من المقاطع المصورة.

علاوة على ذلك، يدعم "جينى" بشكل مبتكر إدخال الرسومات التي صممها البشر أو الصور الواقعية. باستخدام نماذج متقدمة لتوليد الصور من النصوص، يمكن لـ "جينى" تحويل الإطار الأول إلى كون افتراضي تفاعلي، مما يوسع من إمكانياته بشكل كبير.

يؤكد تيم روكتاشل، رئيس فريق "جينى"، أن "جينى" يمثل خطوة حاسمة نحو تطوير الذكاء الاصطناعي العام (AGI)، وهو مهيأ لإعادة تشكيل مشهد البيئات التفاعلية المولدة ووضع الأساس للتقدمات المستقبلية في الذكاء الاصطناعي.

باختصار، قدمت Google DeepMind نموذج "جينى"، مما يبشر بتحول ثوري في صناعة ألعاب الفيديو. إن قدرته على إنشاء عوالم افتراضية قابلة للتشغيل من صورة واحدة تشير إلى التكامل الواسع المحتمل للذكاء الاصطناعي في عالم الألعاب.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles