Stable Audio Open : Un nouveau choix pour la création audio avec le modèle de génération audio open source de Stable AI.

Récemment, Stability AI a lancé un modèle d'IA open source révolutionnaire appelé Stable Audio Open, élargissant sa célèbre technologie de diffusion de texte en image Stable Diffusion au domaine audio. Ce modèle génère des échantillons audio diversifiés et de haute qualité à partir de prompts fournis par les utilisateurs, renouvelant ainsi la composition musicale et le design sonore.

Stable Audio Open utilise un modèle de diffusion basé sur des transformateurs (DiT) pour créer de l'audio dans l'espace latent d'un autoencodeur, améliorant considérablement la qualité et la variété des sons générés. Il peut produire des clips musicaux allant jusqu'à 47 secondes, ce qui le rend idéal pour des applications variées comme les rythmes de batterie, les mélodies instrumentales, les sons ambiants et les effets sonores.

Le modèle est désormais officiellement open source sur la plateforme HuggingFace, permettant aux utilisateurs de l'expérimenter directement. Pendant son entraînement, Stable Audio Open a été alimenté par plus de 486 000 échantillons provenant de bibliothèques musicales telles que FreeSound et Free Music Archive, garantissant une large couverture de styles et de genres dans l'audio généré.

Il est important de noter que bien que Stable Audio Open excelle dans la création de courts clips musicaux de haute qualité, il n'est pas conçu pour produire des chansons complètes, des mélodies ou des pistes vocales. Le modèle est conçu comme un outil de création audio rapide et polyvalent, plutôt qu'un remplacement pour les logiciels de production musicale professionnels.

De plus, Stable Audio Open se distingue du modèle commercial précédent de Stability AI, Stable Audio 2.0, qui peut générer des pistes audio complètes d'une durée maximale de 3 minutes pour répondre à un large éventail de besoins en création audio. En revanche, Stable Audio Open se concentre sur de courts extraits audio et des effets sonores, offrant aux utilisateurs une plus grande personnalisation et flexibilité.

La sortie de Stable Audio Open représente une avancée significative pour Stability AI dans le domaine de la génération audio. Alors que la technologie de l'intelligence artificielle continue d'évoluer, nous sommes impatients de découvrir d'autres modèles innovants et pratiques de génération audio et leurs applications.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles