جوجل تكشف عن فيو: نموذج جديد مذهل لتوليد الفيديو بالذكاء الاصطناعي لمنافسة سورا من أوبن AI.

Home أخبار الذكاء الاصطناعي جوجل تكشف عن فيو: نموذج جديد مذهل لتوليد الفيديو بالذكاء الاصطناعي لمنافسة سورا من أوبن AI.

Updated on مايو 14 2024

منذ أن قدمت OpenAI نموذجها لإنشاء الفيديوهات باستخدام الذكاء الاصطناعي Sora في وقت سابق من هذا العام، لم يضاهِ أي منافس واقعيته وجودته - حتى الآن.

خلال مؤتمر المطورين السنوي I/O، أعلنت Google عن Veo، نموذج جديد للذكاء الاصطناعي التوليدي للفيديو تم تطويره من قبل قسم DeepMind الشهير. تصف Google Veo بأنه قادر على إنتاج "مقاطع عالية الجودة بدقة 1080p تتجاوز مدتها 60 ثانية". وفقًا لمنشور على حساب DeepMind في X، يتعامل النموذج مع مجموعة متنوعة من الأنماط السينمائية، بدءًا من الواقعية التصويرية والسريالية وصولًا إلى الرسوم المتحركة.

على صفحة المنتج، تفيد Google بأن الهدف من Veo هو "جعل إنتاج الفيديو متاحًا للجميع"، سواء كان المستخدمون مخرجين محترفين أو مبتدئين أو معلمين. يدعم Veo تحويلات النص إلى فيديو، والفيديو إلى فيديو، والصورة إلى فيديو.

بالتعاون مع الفنان المتعدد المواهب دونالد غلافر، المعروف أيضًا بـ Childish Gambino، اختبرت Google ميزات Veo الجديدة من خلال استوديوه الإبداعي Gilga. عرضت DeepMind قدرات Veo المذهلة من خلال مجموعة من الفيديوهات المولدة على حساباتها في YouTube وX، والتي تحتوي على مشاهد مثل مدينة نيون، وقناديل بحرية حية، ورعاة بقر يمتطون الخيول، وسفن فضائية تستكشف الكون، وتفاعلات بشرية. النتائج تشبه إلى حد كبير مقاطع الحركة الحية والرسوم المتحركة المتقنة، وكلها تم إنشاؤها من أوامر نصية بسيطة.

في منشور مدونة للمسؤولين في Google، إلي كولينز ودوغلاس إيك، يُبرز Veo بمستوى غير مسبوق من السيطرة الإبداعية، مع فهم قوي للمصطلحات السينمائية مثل "التصوير الزمني" و"اللقطات الجوية".

علاوة على ذلك، يسهل Veo تعديلات سريعة وعالية الجودة على الفيديوهات المولدة بالذكاء الاصطناعي وتلك التي يرفعها المستخدمون، بما في ذلك اللقطات المسجلة مسبقًا. على سبيل المثال، يمكن للمستخدمين إدخال أمر تحرير، مثل إضافة قوارب الكاياك إلى لقطة ساحلية جوية، ويقوم Veo بتنفيذ ذلك بسلاسة في الفيديو الأصلي.

يتميز Veo أيضًا بالحفاظ على الاتساق بين إطارات الفيديو، مما يعالج بعض عدم التناسق الذي غالبًا ما يوجد في نماذج أخرى، بما في ذلك Sora. يحقق ذلك من خلال المحولات المتقدمة لتشتت الحالات، مما يضمن أن الشخصيات والأشياء تظل متماسكة وواقعية.

لتحسين أدائه، عملت Google على تحسين تسميات بيانات التدريب واستخدمت تمثيلات فيديو مضغوطة عالية الجودة. هذه التحسينات تعزز جودة الفيديو بشكل عام وتقلل من زمن الإنتاج.

تحتوي جميع الفيديوهات التي ينتجها Veo على علامة شهادات SynthID، وهي علامة مائية تثبت حالتها كمحتوى مولد بواسطة الذكاء الاصطناعي.

يمثل Veo سنوات من أبحاث DeepMind، حيث يبني على ابتكارات سابقة مثل شبكة الاستفسار التوليدية (GQN)، وDVD-GAN، وImagen-Video، وPhenaki، وWALT، وVideoPoet، وLumiere. حاليًا، Veo غير متاح للجمهور. مثل نموذج OpenAI مع Sora، فإنه متاح لمجموعة مختارة من المبدعين من خلال عرض خاص في VideoFX. تخطط Google في النهاية لإدماج بعض ميزات Veo في YouTube Shorts وغيرها من المنتجات.

كيفية تقليل تكاليف استنتاج نماذج اللغة الكبيرة من خلال إبعاد الانتباه عند النطاق الواسع

جوجل تكشف عن إميجين 3: النموذج النهائي لتحويل النص إلى صورة الآن في المعاينة الخاصة

Most people like

Trend AI Tools

11.2K

اكتشف المجموعة النهائية من مواقع تجميع الذكاء الاصطناعي التي تم تصميمها لتعزيز إنتاجيتك. سواء كنت بحاجة إلى مساعدة في الكتابة أو تحليل البيانات أو المشاريع الإبداعية، تقدم لك هذه المنصات أفضل الأدوات لتلبية احتياجاتك. استعرض قائمتنا المخصصة لأفضل موارد الذكاء الاصطناعي المتاحة اليوم، وارفع مستوى سير عملك مع التكنولوجيا المتطورة في متناول يدك.

أدوات الذكاء الاصطناعي AI Tools Directory

Text Reader

112.9K

اكتشف قوة تقنية تحويل النص إلى كلام المجانية، التي تتميز بأصوات الذكاء الاصطناعي الواقعية التي تضفي الحيوية على محتواك المكتوب.

نص إلى كلام AI Speech Synthesis

Lawdeck

8.8K

افتح إمكانيات إنشاء المستندات القانونية والبحث المدعومة بالذكاء الاصطناعي. اكتشف كيف تساعد تقنيات الذكاء الاصطناعي المتقدمة في تبسيط عملية الصياغة وتعزز قدرتك على العثور على المستندات القانونية الحيوية بسرعة. حول ممارستك القانونية باستخدام أدوات فعالة مصممة لتبسيط المهام المعقدة وتحسين الدقة في سير العمل القانوني. قم بتحسين عملياتك القانونية اليوم مع حلول الذكاء الاصطناعي المتطورة.

أتمتة الوثائق القانونية Legal Assistant

Quadratic

18.8K

في عصرنا الرقمي السريع، يحتاج المطورون إلى أدوات فعالة لتعزيز التعاون وزيادة الإنتاجية. تقدم الجداول البيانية التفاعلية حلاً قوياً، مما يمكّن الفرق من العمل في وقت واحد على إدارة البيانات وتحليلها. لا يعزز هذا النهج التفاعلي التواصل السلس فحسب، بل يتيح أيضاً تحديثات فورية، مما يجعله مورداً أساسياً للمطورين الذين يسعون لتحسين سير العمل. اكتشف كيف يمكن لتكامل الجداول البيانية التفاعلية أن يرتقي بجهود إدارة المشاريع والتعاون في البيانات.

علوم البيانات AI Spreadsheet

Find AI tools in YBX