OpenAI continue de présenter des extraits de Sora, son modèle vidéo génératif photoréaliste avancé, qui reste pour l'instant strictement interne. Dans un paysage de l'IA vidéo en pleine évolution, des concurrents comme Pika profitent de cette opportunité.
Récemment, Pika a lancé une nouvelle fonctionnalité permettant aux utilisateurs de générer automatiquement des effets sonores pour leurs vidéos générées par IA sur sa plateforme, pika.art. Cette amélioration apporte une dimension essentielle aux vidéos d'IA, souvent dépourvues de son et qui nécessitaient auparavant de chercher des fichiers audio via différents logiciels de montage. Désormais, les utilisateurs de Pika peuvent créer des fichiers sonores directement dans l'application, simplifiant ainsi le processus créatif.
Cette mise à jour suit le lancement des capacités de synchronisation labiale de Pika, améliorant davantage le contenu généré par IA pour les créateurs individuels et les entreprises. Avec des fonctionnalités telles que la synchronisation labiale, les effets sonores, les voix off et les visuels intégrés, Pika se positionne comme une plateforme de création vidéo générative tout-en-un. Cela permet aux utilisateurs de réaliser des projets entiers sans avoir besoin de caméramans ou de sound designers séparés.
Les capacités significatives offertes par Pika pourraient séduire les cinéastes, leur permettant d'éliminer le besoin de rechercher différents éléments. Au lieu de fouiller dans des bases de données de contenus, les utilisateurs peuvent simplement décrire leur vision et générer rapidement tous les éléments nécessaires directement depuis leur imagination.
Actuellement, la nouvelle fonctionnalité d'effets sonores de Pika est uniquement disponible pour les membres de son programme de super-collaborateurs ou les utilisateurs abonnés Pro à 58 $/mois. Cependant, des plans sont en cours pour étendre la disponibilité au-delà de la phase de test bêta.
Comment Pika va-t-il intégrer des effets sonores dans ses vidéos IA ?
Pika a confirmé que les utilisateurs peuvent obtenir des effets sonores de deux manières principales :
1. Génération contextuelle : Les modèles d'IA sélectionnent automatiquement l'audio qui complète le mieux la vidéo générée en fonction de l'invite textuelle. Les utilisateurs activent simplement le bouton « effets sonores » lors de la saisie de leur invitation, et le modèle de Pika produit une sortie audiovisuelle complète en quelques secondes.
2. Approche de suivi : Les utilisateurs peuvent ajouter des sons générés par IA après la création. Après avoir généré ou téléchargé un extrait sans son, ils peuvent cliquer sur 'Modifier' et sélectionner 'Effets sonores' pour décrire les sons souhaités. Le modèle générera alors plusieurs options parmi lesquelles choisir.
L'introduction de l'audio généré devrait considérablement améliorer le processus créatif, en répondant aux inefficacités précédentes liées à la recherche de sources audio externes. Pika se vante d'être la première plateforme vidéo IA à intégrer de l'audio généré comme partie intégrante de la sortie vidéo.
D'autres entreprises explorent également la génération sonore, avec ElevenLabs annonçant récemment des préinscriptions pour une fonctionnalité IA texte-vers-son, tandis que Meta propose une technologie similaire appelée AudioGen. Cependant, aucune de ces options n'offre un modèle vidéo génératif IA intégré comme le fait Pika.
Déploiement progressif à venir
La nouvelle fonctionnalité d'effets sonores sera déployée progressivement, en commençant par ceux du programme de super-collaborateurs ou les abonnés Pro de Pika. Les retours de ces premiers utilisateurs aideront à peaufiner la fonctionnalité, permettant des améliorations futures accessibles à tous les utilisateurs de la plateforme.
Depuis son lancement en décembre 2023, Pika a considérablement renforcé ses offres pour rivaliser avec des acteurs comme le prochain Sora d'OpenAI. Les collaborations récentes, telles que la fonctionnalité de synchronisation labiale développée avec ElevenLabs, permettent aux utilisateurs d'ajouter des voix IA et des animations synchronisées à leurs vidéos. Les effets sonores ajoutés enrichiront encore ces expériences immersives.
À mesure que Pika évolue, elle prévoit d'introduire davantage de fonctionnalités, ayant levé 55 millions de dollars de financement à une valorisation de près de 200 millions de dollars. L'entreprise se positionne pour défier non seulement OpenAI, mais aussi d'autres acteurs majeurs dans le domaine de l'IA créative, notamment Adobe, Runway, Stability AI et le récemment lancé Haiper.