في مؤتمر Google I/O لهذا العام، كشفت جوجل عن أحدث محركاتها لإنشاء المحتوى باستخدام الذكاء الاصطناعي—Veo وImagen 3. يتمتع Veo بقدرة على إنتاج مقاطع فيديو عالية الجودة بدقة 1080p، بينما يمثل Imagen 3 الإطار الأحدث لتوليد الصور من النصوص. على الرغم من أن هذه المنتجات قد لا تُحدث ثورة في الصناعة، إلا أنها تساعد جوجل في الحفاظ على ميزتها التنافسية ضد نموذج فيديو Sora من OpenAI وDALL-E 3.
تزعم جوجل أن Veo يملك "فهمًا عميقًا للغة الطبيعية ودلالات البصرية"، مما يمكنه من إنتاج مقاطع فيديو تتجاوز مدتها دقيقة بناءً على أوصاف المستخدم. كما يستوعب مفاهيم تتعلق بصناعة الأفلام والتكنولوجيا المرئية، مثل التصوير بتقنية الزمن المتقطع، والتي أصبحت ميزات أساسية لنماذج توليد الفيديو بواسطة الذكاء الاصطناعي.
لإظهار قدرات Veo، تعاونت جوجل مع دونالد غلوفر واستوديوه الإبداعي، Gilga، لإنتاج فيديو ترويجي يتضمن مشاهد لرحلة بالطريق في سيارة قابلة للتحويل والإبحار، تم إنشاؤها من أوصاف نصية. وفقًا لجوجل، يتجاوز Veo النماذج السابقة في محاكاة الظواهر الفيزيائية في العالم الحقيقي وعرض المرئيات عالية الدقة. وأشار غلوفر في الفيديو، "يجب على الجميع أن يكونوا مخرجين؛ رواية قصص بعضنا البعض ستعزز فهمنا."
بينما لا يزال من غير المؤكد ما إذا كان الجمهور سيقبل مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي—مدفوعًا بشكل رئيسي بالفضول حول خيال الآلات في إعادة إنتاج الفنون البشرية—إلا أن هذا لم يمنع جوجل وOpenAI من الترويج لأدواتهما. أصبح Veo الآن متاحًا في أداة VideoFX الخاصة بجوجل لمجموعة مختارة من المبدعين، مع خطط للإطلاق على منصات مثل YouTube Shorts. وعند دمجه في YouTube Shorts، يمكن أن يحسن بشكل كبير من موقف جوجل التنافسي ضد TikTok.
أما بالنسبة لـ Imagen 3، فتؤكد جوجل أنه النموذج "الأعلى جودة" لديها لتوليد الصور من النصوص، حيث ينشئ "صورًا واقعية وحيوية" مع تقليل العيوب. تكمن التحدي الحقيقي في المقارنة مع DALL-E 3، حيث تشير جوجل إلى أن Imagen 3 أذكى في التعامل مع النصوص والمطالبات الطويلة.
علاوة على ذلك، تعاونت جوجل مع الفنانين الموسيقيين ويكلف جان وبورن لاختبار أداتها الخاصة بالذكاء الاصطناعي في الموسيقى، المصممة للمساعدة في إنشاء الأغاني والإيقاعات. وعلى الرغم من أن المحتوى المعروض حتى الآن كان موجزًا، إلا أنه قدم بعض الأمثلة المثيرة للاهتمام.
من الشروق إلى تقدم الإنسان في العمر، أصبح الذكاء الاصطناعي أكثر ذكاءً. تتجه أدوات إنشاء المحتوى الجديدة لجوجل في هذا الاتجاه. مع استثمارات بمليارات الدولارات في الذكاء الاصطناعي، تهدف جوجل إلى قيادة الانقلاب المقبل في تكنولوجيا الحوسبة. يبقى الإمكانات المستقبلية لهذه التقنيات لتعزيز الحياة أو إنشاء فن عاطفي موضوعًا مهمًا لمتابعة.