Est-ce à cela que devrait ressembler le matériel d'IA ?
C'est la question qui m'occupe depuis le début du mois, lorsque j'ai vu Cristóbal Valenzuela, PDG de la startup de vidéo générative Runway ML, publier une vidéo de la "1stAI Machine" sur son compte X.
Valenzuela l'a décrite comme "le premier dispositif physique de montage vidéo généré par l'IA", affirmant : "Nous prévoyons que la qualité des vidéos égalera bientôt celle des photos. À ce moment-là, tout le monde pourra créer des films sans caméra, lumières ni acteurs ; il suffira d'interagir avec les IA. Un outil comme la 1stAI Machine anticipe ce moment en explorant des interfaces tangibles qui stimulent la créativité."
La vidéo présentait un appareil angulaire de couleur argentée mate — la soi-disant "première planche de montage IA". Avec des cadrans et des boutons physiques pour contrôler divers styles d'entrée, il était nettement plus grand qu'un ordinateur portable ordinaire.
En tant que journaliste couvrant les outils d'IA dans la créativité et la production médiatique, je suis intrigué. Runway, qui s'était jusqu'alors concentré uniquement sur les logiciels basés sur le web, se lançait-il dans le matériel ? Si oui, quel en serait le prix, le délai de livraison et le public cible ?
L'Émergence du Matériel d'IA
La semaine dernière, un autre dispositif d'IA, l'Ai Pin de Humane, a été lancé avec des critiques mitigées, principalement à propos de son prix de 699 $ et de son abonnement mensuel de 24 $. Ce pin magnétique, conçu par d'anciens ingénieurs d'Apple, agissant comme un assistant de vie, est alimenté par le modèle GPT-4 d'OpenAI et a même figuré sur la liste des 200 meilleures inventions de 2023 de Time Magazine.
L'avènement du matériel d'IA est indéniable. Alors, où s'inscrit la 1stAI Machine, qui l'a développée et quelle en a été l'inspiration ?
La Vision derrière la Machine
Valenzuela a crédité "SpecialGuestX pour 1stAveMachine" dans son post. J'ai contacté Valenzuela, SpecialGuestX (SGX) et 1stAveMachine la semaine dernière. Miguel Espada, cofondateur de SGX, a répondu, affirmant que leur agence explore de nouvelles narrations autour des données, de l'automatisation et de l'IA.
Espada a confirmé que sa petite équipe à Madrid avait créé la 1stAI Machine. Nous avons organisé une démonstration pratique dans les bureaux de 1stAveMachine à Brooklyn, un collectif de créatifs collaborant avec de grandes marques.
L'expérience d'Espada avec l'IA dans les projets artistiques est vaste ; il a été un membre précoce de la communauté Disco Diffusion, qui a ensuite évolué vers le modèle AI Stable Diffusion. Son agence a précédemment adapté Stable Diffusion pour générer des vignettes vidéo personnalisées pour les clients de Carvana.
Disponibilité de la 1stAI Machine
Ne vous emballez pas pour acquérir une 1stAI Machine pour le moment. Espada a précisé qu'il s'agit actuellement d'un prototype unique. "Il n'y a pas de projets de vente, mais nous avons des produits matériels sur notre feuille de route", a-t-il noté.
La 1stAI Machine est née d'une proposition client dans le secteur automobile, visant à convertir des storyboards pour un nouveau modèle de voiture en vidéos génératives à l'aide du logiciel Gen-2 de Runway. Bien que le client n'ait pas poursuivi l'idée, Espada et son équipe ont décidé de construire une planche de montage vidéo générative comme preuve de concept, indépendamment de l'implication de Runway.
Espada a souligné : "Elle est propulsée par Runway, mais ce n'est pas un produit Runway. Son PDG, Cristóbal Valenzuela, l'a repartagée parce qu'il l'a trouvée intéressante."
Son Fonctionnement
Lors de la démonstration dans les bureaux de 1stAveMachine à Brooklyn, la 1stAI Machine s'est démarquée comme un prototype impressionnant, avec un châssis en aluminium mate et des commandes satisfaisantes évoquant des équipements audio vintage.
La machine possède huit écrans : un écran LCD en couleur pour la vidéo finale, six écrans plus petits pour les storyboards, et une bande d'état affichant des messages d'opération tels que "lecture" ou "génération". Les utilisateurs suivent un flux de travail numéroté : 1. Histoire, 2. Style, 3. Musique, la quatrième section étant réservée à la sortie audio.
Actuellement, l'appareil utilise une douzaine de storyboards de films emblématiques, notamment Pulp Fiction, E.T., Titanic, Le Parrain et Star Wars. Les utilisateurs peuvent sélectionner six storyboards pour former la base d'une vidéo de 30 secondes, avec des transformations appliquées par l'IA Gen-2.
Espada a présenté une démonstration frappante transformant une scène de Titanic en une visualisation vibrante avec des éléments inhabituels.
Sélection de Musique et de Style
La machine dispose également d'un sélecteur de musique intuitif, permettant aux utilisateurs de choisir des pistes générées par l'IA à travers plusieurs genres. L'audio sert de bande sonore pour la vidéo, soutenant une fusion hybride entre les genres.
Avant le rendu, les utilisateurs doivent choisir un style à l'aide d'un bouton de contrôle. Des styles comme "échelle corporative", "obsession Barbie" et "avenir inattendu" contribuent de manière unique à l'esthétique finale de la vidéo. Espada envisage des itérations futures où les utilisateurs pourraient télécharger des styles personnalisés.
À l'intérieur de la machine se trouve un Mac Mini fonctionnant sous Linux avec un logiciel développé sur Python et OpenFrameworks, offrant des capacités sans fil pour un transfert facile des vidéos.
Perspectives Futures pour la 1stAI Machine
Bien que la 1stAI Machine actuelle soit un prototype autonome, l'intérêt de la communauté de l'IA suggère qu'un modèle plus avancé pourrait émerger, nécessitant potentiellement un matériel moins puissant.
Espada imagine des scénarios où une version future pourrait être utilisée lors de festivals ou de conventions, permettant aux participants de créer et de projeter des vidéos générées par l'IA sur de plus grands écrans.
Malgré ces possibilités, Espada n'est pas intéressé par le lancement d'une entreprise de matériel autonome. Il préfère se concentrer sur la narration pour les clients.
L'équipe estime qu'un matériel dédié à l'IA sert des objectifs spécifiques, canalisant la créativité des utilisateurs dans un environnement ciblé, semblable à la façon dont les professionnels utilisent des outils spécialisés dans les arts visuels et la musique.
Après mon expérience pratique avec la 1stAI Machine, je peux affirmer avec confiance : c'est probablement à cela que devrait ressembler le matériel d'IA.