Stability AI lance Stable Audio : une révolution pour les professionnels de la conception sonore.

Home Actualités IA Stability AI lance Stable Audio : une révolution pour les professionnels de la conception sonore.

Stability AI lance son IA générative pour l'audio avec l'introduction de Stable Audio Open 1.0. Réputée pour sa technologie Stable Diffusion de conversion texte-image, Stability AI propose un large éventail de modèles incluant le code, le texte, et désormais l'audio. En septembre 2023, l'entreprise a présenté Stable Audio, un outil d'IA générative texte-à-audio. Le modèle suivant, Stable Audio 2.0, lancé le 3 avril, a amélioré la clarté et la durée des audios.

Stable Audio Open, bien qu'il soit disponible pour un usage commercial général, se concentre sur la production de morceaux audio courts, tels que des effets sonores, plutôt que des chansons complètes. Ce modèle n'est pas entièrement open source et fonctionne sous la licence de la communauté de recherche non commerciale de Stability AI, offrant un usage limité.

« Notre objectif avec Stable Audio Open est de fournir aux chercheurs et producteurs audio un accès pratique à l'un de nos modèles audio génératifs, afin de faciliter la recherche, l'adoption et l'exploration créative », a déclaré Zach Evans, responsable de la recherche audio chez Stability AI.

Qu'est-ce que Stable Audio Open ?

Stable Audio Open se spécialise dans la création de rythmes de batterie, de riffs d'instruments, de sons ambiants et d'autres échantillons audio pour la production musicale et le design sonore. Contrairement à la version commerciale de Stable Audio, qui génère des morceaux musicaux cohérents de jusqu'à trois minutes, Stable Audio Open se concentre sur la production de clips audio de haute qualité d'une durée maximale de 47 secondes, guidés par des invites textuelles.

Stability AI privilégie des pratiques d'entraînement responsables, utilisant des données audio provenant de FreeSound et du Free Music Archive pour éviter les matériaux protégés par des droits d'auteur sans autorisation.

Affinage pour une liberté créative

Un avantage majeur de Stable Audio Open est sa capacité d'affinage, permettant aux utilisateurs de personnaliser le modèle avec leurs propres données audio. Par exemple, les batteurs peuvent affiner le modèle en utilisant leurs enregistrements de batterie pour générer des rythmes uniques.

Le processus d'affinage utilise la bibliothèque Stable Audio Tools, qui est sous un cadre open-source. Les poids du modèle sont également disponibles sur Hugging Face. « L'équipe de recherche audio travaille continuellement à améliorer la qualité et le contrôle de nos modèles audio génératifs », a ajouté Evans. « Nous prévoyons des sorties futures de modèles commerciaux et open qui reflètent nos avancées en recherche. »

Mistral dévoile de nouveaux outils de fine-tuning pour une personnalisation de ses modèles d'IA plus rapide et plus simple.

Comment la demande énergétique de l'IA transforme les stratégies d'approvisionnement informatique

Most people like

Diib

188.7K

Diib est un outil SEO innovant conçu pour élaborer un plan de croissance personnalisé en analysant de manière fluide les données de votre site web en lien avec Google Analytics. En seulement 60 secondes, vous pouvez améliorer votre SEO, la vitesse de votre site, la sécurité et l'expérience utilisateur globale grâce à des recommandations claires et adaptées à vos besoins.

outil SEO AI SEO Assistant

InVideo AI

10.1M

InVideo est une plateforme de montage vidéo en ligne puissante qui propose une large gamme de modèles premium, des images de haute qualité et une vaste bibliothèque musicale. Que vous créiez du contenu promotionnel, des vidéos pour les réseaux sociaux ou des projets personnels, InVideo vous offre les outils nécessaires pour améliorer vos vidéos et captiver efficacement votre audience.

Éditeur de vidéo en ligne AI Video Editor

Topic Mojo

39.2K

Topic Mojo est un outil de recherche puissant conçu pour fournir des insights précieux aux créateurs de contenu, les aidant à élaborer un contenu engageant et pertinent. En s'appuyant sur une analyse approfondie des données, Topic Mojo permet aux utilisateurs de prendre des décisions éclairées qui améliorent leur processus de création de contenu.

Recherche de sujets Research Tool

WindChat

15.9K

Découvrez comment prévisualiser sans effort le code HTML de Tailwind CSS directement dans ChatGPT. Améliorez votre expérience de conception web et optimisez votre flux de travail grâce à cette approche efficace. Que vous soyez débutant ou développeur expérimenté, ce guide vous aidera à tirer parti de la puissance de Tailwind CSS en parallèle avec ChatGPT pour une productivité et une créativité accrues. Plongez-y pour en savoir plus !

ChatGPT AI Developer Tools

Find AI tools in YBX