OpenAI élargit ses horizons au-delà de l'image d'entreprise spécialisée uniquement dans ChatGPT ou les LLM. Aujourd'hui, l'organisation a dévoilé Sora, son modèle innovant de génération de vidéos à partir de textes. Le cofondateur et PDG, Sam Altman, a décrit ce lancement comme un « moment remarquable » dans un message sur X (anciennement Twitter).
Actuellement, Sora n'est pas accessible au grand public. Altman a expliqué qu'il est en phase de « red-teaming initial », un test de sécurité visant à identifier d'éventuels défauts et abus. Cependant, un « nombre limité de créateurs » a accès au modèle, et une disponibilité plus large est attendue à l'avenir.
Entrée sur un marché concurrentiel
Sora entre dans un secteur hautement concurrentiel, rejoignant des startups comme Runway, Pika et Stability AI, qui offrent déjà des solutions de génération vidéo par IA, ainsi que des acteurs établis tels que Google avec son modèle Lumiere.
Ce qui distingue Sora, c'est sa qualité impressionnante. Les vidéos d'exemple publiées par OpenAI démontrent une netteté remarquable, un mouvement fluide et une précision dans la représentation de l'anatomie humaine et des environnements physiques. Notamment, Sora peut générer des vidéos d'une minute en une seule fois, surpassant des concurrents comme Runway et Pika, qui ne produisent que 4 secondes de vidéo à la fois.
Dans une initiative engageante, Altman et l'équipe de Sora, incluant le chercheur Will Depue, collectent des propositions d'utilisateurs sur Twitter/X. Ils utilisent ces contributions pour mettre en avant les capacités de Sora en temps réel, créant ainsi une démonstration crowdsourcée du potentiel du modèle.
Réalité des moments quotidiens
Au-delà de visuels captivants, Sora excelle dans la représentation de scènes quotidiennes avec un réalisme étonnant. Les vidéos illustrant des expériences ordinaires, telles que des paysages urbains vus depuis un train élevé ou des moments intimes comme une femme avec son chat, mettent en lumière la capacité de Sora à capturer des expériences humaines relatables.
De plus, le chercheur d'OpenAI Bill Peebles, qui se concentre sur l'atteinte de « l'intelligence généralisée artificielle » (AGI) — une IA surpassant les performances humaines dans des tâches économiquement précieuses — a fait remarquer que Sora aidera de manière significative cette quête en permettant des simulations complètes.
Un moment décisif pour l'IA
Avec l'intensification des efforts des agences fédérales américaines pour réguler l'IA face aux inquiétudes liées à la fraude et aux deepfakes, l'introduction de Sora représente une étape importante non seulement pour OpenAI mais aussi pour l'ensemble des secteurs technologiques et médiatiques. L'impact de Sora sur la société, qu'il soit positif ou négatif, reste à être pleinement réalisé.