Stability AI Lanza Stable Audio: Un Revolucionario para Profesionales del Diseño de Sonido

Stability AI lanza su IA generativa para audio con Stable Audio Open 1.0. Reconocida por su tecnología Stable Diffusion de texto a imagen, Stability AI cuenta con un portafolio diverso que incluye modelos para código, texto y ahora audio. En septiembre de 2023, la empresa presentó Stable Audio, una herramienta de IA generativa de texto a audio. El siguiente lanzamiento, Stable Audio 2.0, se publicó el 3 de abril, mejorando la claridad y duración del audio.

Stable Audio Open, aunque está disponible para uso comercial general, se centra en producir piezas de audio más cortas, como efectos de sonido, en lugar de canciones completas. Este modelo no es totalmente de código abierto; funciona bajo la licencia de acuerdo de investigación no comercial de Stability AI, lo que limita su uso.

“Nuestro objetivo con Stable Audio Open es ofrecer a investigadores y productores de audio acceso práctico a uno de nuestros modelos generativos, facilitando la investigación, la adopción y la exploración creativa,” comentó Zach Evans, jefe de investigación de audio en Stability AI.

¿Qué es Stable Audio Open?

Stable Audio Open se especializa en crear ritmos de batería, riffs de instrumentos, sonidos ambientales y otras muestras de audio para producción musical y diseño de sonido. A diferencia del producto comercial Stable Audio, que genera pistas musicales coherentes de hasta tres minutos, Stable Audio Open se enfoca en producir clips de audio de alta calidad de hasta 47 segundos, guiados por indicaciones de texto.

Stability AI prioriza prácticas de entrenamiento responsables, utilizando datos de audio de FreeSound y el Free Music Archive para evitar materiales con derechos de autor sin permiso.

Ajustes para la Libertad Creativa

Una ventaja significativa de Stable Audio Open es su capacidad de ajuste fino, que permite a los usuarios personalizar el modelo con sus propios datos de audio. Por ejemplo, los bateristas pueden perfeccionar el modelo usando sus grabaciones de batería para generar ritmos únicos.

El proceso de ajuste fino utiliza la biblioteca de herramientas de Stable Audio, que está licenciada bajo un marco de código abierto. Los pesos del modelo también están disponibles en Hugging Face.

“El equipo de investigación de audio trabaja continuamente para mejorar la calidad y el control de nuestros modelos generativos de audio,” agregó Evans. “Prevemos futuros lanzamientos comerciales y de modelos abiertos que reflejen nuestros avances en investigación.”

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles