تحليل Google Gemini 1.5 مقابل OpenAI Sora: تكنولوجيا إنشاء الفيديوهات ذات الجاذبية البصرية ولكن مع قيود كبيرة

مؤخراً، أجرى نموذج الذكاء الاصطناعي المتقدم من جوجل، جمني 1.5، تقييمًا معمقًا لأداة إنتاج الفيديو الجديدة من OpenAI، سورا. في حين أن سورا تنتج فيديوهات بصرية مذهلة، إلا أن جمني 1.5 أشار إلى عدة تفاصيل غير منطقية.

خذ على سبيل المثال، فيديو يصور مشهدًا لشارع ياباني أنشأته سورا. يظهر الفيديو مزيجًا غير واقعي من تساقط الثلوج الكثيف وتفتح أزهار الكرز. في الواقع، تتفتح أزهار الكرز في الطقس الدافئ خلال الربيع، مما يجعل هذا السيناريو مستحيلاً. بالإضافة إلى ذلك، يبدو تساقط الثلوج موحدًا بشكل غير طبيعي، مما يختلف بشكل كبير عن أنماط تساقط الثلوج الحقيقية. الأبرز من ذلك هو أن الشخصيات في الفيديو ترتدي ملابس صيفية على الرغم من الظروف الشتوية، مما يبرز نقص الواقعية في الفيديو.

علق محللو جمني 1.5 قائلين: "على الرغم من أن فيديوهات سورا جذابة بصريًا، إلا أن التناقضات الواضحة تشير إلى أن هذه المشاهد لا تستند إلى الواقع." هذا التقييم يسلط الضوء على التحديات الحالية التي تواجهها تقنية إنشاء الذكاء الاصطناعي من حيث الأصالة والتناسق المنطقي.

علاوة على ذلك، يُظهر نموذج جمني 1.5 قوة معالجة استثنائية مع نافذة سياقية تصل إلى مليون توكن، مما يتجاوز بكثير منافسيه. تتيح له هذه القدرة التعامل مع كميات هائلة من المعلومات دفعة واحدة، بما في ذلك فيديوهات تصل مدتها إلى ساعة واحدة وأكثر من 30,000 سطر من الشيفرة البرمجية.

بينما تستمر تقنية الذكاء الاصطناعي في التطور، نترقب رؤية إنتاج فيديوهات أكثر واقعية وحيوية في المستقبل.

Most people like

Find AI tools in YBX