Kürzlich hat das fortschrittliche KI-Modell Gemini 1.5 eine umfassende Bewertung des neu eingeführten Video-Generationstools Sora von OpenAI vorgenommen. Obwohl Sora visuell beeindruckende Videos erstellt, wies Gemini 1.5 auf mehrere illogische Details hin.
Nehmen wir zum Beispiel ein Video, das eine japanische Straßenszene zeigt und von Sora erstellt wurde. Es kombiniert surreale Elemente wie starken Schneefall und blühende Kirschbäume. In Wirklichkeit blühen Kirschbäume jedoch nur bei warmem Frühlingswetter, was dieses Szenario unmöglich macht. Zudem erscheint der Schneefall unangemessen gleichmäßig und weicht deutlich von typischen Schneefallmustern ab. Besonders auffällig ist, dass die Charaktere im Video trotz winterlicher Bedingungen Sommerkleidung tragen, was die Unrealität des Videos weiter verdeutlicht.
Analysten von Gemini 1.5 kommentierten: „Obwohl Soras Videos visuell ansprechend sind, zeigen die eklatanten Inkohärenzen, dass diese Szenen nicht aus der Realität stammen.“ Diese Bewertung verdeutlicht die aktuellen Herausforderungen, mit denen die Technologie der KI-Generierung in Bezug auf Authentizität und logische Kohärenz konfrontiert ist.
Darüber hinaus demonstriert das Modell Gemini 1.5 außergewöhnliche Verarbeitungskapazitäten mit einem Kontextfenster von einer Million Tokens, das seine Wettbewerber weit übertrifft. Diese Fähigkeit ermöglicht es ihm, enorme Mengen an Informationen gleichzeitig zu verarbeiten, einschließlich Videos von bis zu einer Stunde Länge und über 30.000 Zeilen Code.
Während sich die KI-Technologie weiterentwickelt, freuen wir uns darauf, in Zukunft immer realistischere und lebendigere Video-Generierungen zu erleben.