Aujourd'hui, Synthesia, une startup innovante basée à Londres qui permet aux entreprises de créer des vidéos professionnelles avec l'IA, a annoncé le lancement de son Assistant Vidéo IA. Cet outil révolutionnaire transforme des sources textuelles en vidéos entièrement synthétiques en quelques minutes.
Désormais disponible pour les clients payants, l'Assistant Vidéo IA améliore les capacités existantes de Synthesia en prenant en charge n'importe quel document ou lien web, simplifiant ainsi la création de vidéos pour les besoins internes et externes des entreprises.
Bien que cet outil puisse considérablement améliorer les efforts de diffusion de contenu, il soulève également des préoccupations concernant les vidéos générées par l'IA et les deepfakes, en particulier en ce qui concerne leur utilisation potentielle pour tromper le public sur des figures publiques.
Que peut faire l'Assistant Vidéo IA de Synthesia ?
Fondée en 2017 par une équipe diverse provenant de l'UCL, Stanford, TUM et Cambridge, Synthesia offre une plateforme complète pour créer des voix IA personnalisées et des avatars réalistes. Les utilisateurs peuvent choisir parmi des avatars existants ou personnaliser les leurs pour produire des vidéos de qualité studio.
Bien que populaire dans les environnements d'entreprise, la création vidéo traditionnelle nécessite un effort considérable, incluant l'écriture de scripts et la conception de mises en page vidéo. Le nouvel Assistant Vidéo IA simplifie ce processus : les utilisateurs n'ont qu'à saisir le matériel source – qu'il s'agisse d'un site web, d'un fichier texte, d'un document Word, d'un PDF ou d'une idée – et à sélectionner un modèle adapté aux objectifs de la vidéo, au nombre de scènes, à la langue et au ton du locuteur.
Selon Sundar Solai, le chef de produit ayant dirigé le développement de l'assistant chez Synthesia, « L'Assistant Vidéo IA utilise l'IA générative pour synthétiser les données de l'utilisateur en fonction de l'objectif vidéo, du public et d'autres spécifications. Des modèles de langage de grande taille génèrent un script et des mises en page de scènes pertinentes basées sur le modèle choisi par l'utilisateur. »
Ce processus génère des résultats en quelques minutes, permettant des modifications rapides si le script initial n'est pas satisfaisant. Les utilisateurs peuvent reconfigurer les paramètres pour améliorer la qualité de sortie.
Amélioration de l'expérience de diffusion de contenu
Insivia rapporte que les spectateurs retiennent 95 % des messages délivrés par vidéo, contre seulement 10 % lorsqu'ils sont lus sous forme de texte. Pourtant, de nombreuses organisations continuent de dépendre de manuels et de PDFs longs pour transmettre des informations critiques. L'Assistant Vidéo IA vise à combler cette lacune, permettant à tous, dans les organisations, de convertir des textes complexes en vidéos de haute qualité en toute simplicité.
Solai a révélé que les tests utilisateurs ont montré un intérêt significatif, bien qu'il n'ait pas divulgué de chiffres spécifiques concernant les premiers utilisateurs ou leurs cas d'utilisation. « Cette fonctionnalité permet une création de vidéo plus rapide et élargit l'accès à la production vidéo pour ceux ayant peu ou pas d'expérience précédente », a-t-il expliqué.
Cependant, il est important de noter que l'Assistant Vidéo IA a actuellement une limite de 4 500 mots pour le texte qu'il peut convertir en vidéo.
Croissance significative malgré les préoccupations liées aux deepfakes
Malgré les débats en cours sur les risques des médias générés par l'IA, Synthesia prospère dans le secteur des entreprises. La société, qui emploie 300 personnes, a levé 90 millions de dollars en juin 2023 et sert plus de 55 000 entreprises, dont la moitié du Fortune 100. Parmi ses clients se trouve Zoom, qui a déclaré créer des vidéos de formation 90 % plus rapidement.
« Cela permet aux experts de contenu de Zoom de récupérer 15 à 20 heures chaque mois, précédemment consacrées à l'enregistrement, pour d'autres responsabilités professionnelles, entraînant des économies mensuelles de 1 000 à 1 500 dollars par employé », a déclaré Alexandru Voica, responsable des affaires corporatives et des politiques chez Synthesia.
Voica a également confirmé que Synthesia améliore la vitesse de sa plateforme et développe la prochaine génération de technologie d'avatar, qui offrira des expressions plus naturelles, de meilleures voix et une personnalisation accrue. Ces avancées rapprocheront les vidéos générées par Synthesia d'une expérience presque lifelike. Les concurrents dans ce domaine incluent Deepbrain AI, Rephrase et HeyGen.