Анализ Google Gemini 1.5 и OpenAI Sora: Технология генерации видео с визуальной привлекательностью и существенными ограничениями

Недавно продвинутая модель ИИ Google Gemini 1.5 провела глубокую оценку нового инструмента генерации видео от OpenAI, Sora. Хотя Sora создает визуально впечатляющие видео, Gemini 1.5 подчеркнула несколько нелогичных деталей.

Например, видео, изображающее японскую уличную сцену, созданное Sora, демонстрирует сюрреалистичное сочетание сильного снегопада и цветущих сакур. На самом деле сакуры цветут в теплую весеннюю погоду, делая этот сценарий невозможным. Кроме того, снегопад выглядит ненатурально однородным, значительно отклоняясь от реальных паттернов снегопада. Еще более поразительно то, что персонажи на видео одеты в летнюю одежду, несмотря на зимние условия, что подчеркивает отсутствие реалистичности.

Аналитики Gemini 1.5 отметили: "Хотя видео Sora визуально привлекательны, явные несоответствия свидетельствуют о том, что эти сцены не соответствуют реальности." Эта оценка освещает современные проблемы, с которыми сталкивается технология генерации ИИ в плане аутентичности и логической согласованности.

Кроме того, модель Gemini 1.5 демонстрирует исключительную мощность обработки с контекстным окном в один миллион токенов, что значительно превосходит ее конкурентов. Эта возможность позволяет ей обрабатывать огромные объемы информации одновременно, включая видео длительностью до часа и более 30,000 строк кода.

По мере того как технологии ИИ продолжают развиваться, мы с нетерпением ждем появления более реалистичной и яркой генерации видео в будущем.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles