Stable Audio Open: Una Nueva Opción para la Creación de Audio con el Modelo de Generación de Audio de Código Abierto de Stable AI

Recientemente, Stability AI lanzó un innovador modelo de inteligencia artificial de código abierto llamado Stable Audio Open, que amplía su reconocida tecnología Stable Diffusion de texto a imagen al ámbito del audio. Este modelo genera muestras de audio de alta calidad y diversidad basadas en indicaciones proporcionadas por los usuarios, revitalizando la composición musical y el diseño sonoro.

Stable Audio Open utiliza un modelo de difusión basado en transformadores (DiT) para crear audio dentro del espacio latente de un autoencoder, mejorando significativamente la calidad y variedad de los sonidos generados. Puede producir clips musicales de hasta 47 segundos, lo que lo convierte en una herramienta ideal para diversas aplicaciones, tales como ritmos de percusión, melodías instrumentales, sonidos ambientales y efectos de sonido.

El modelo ya está disponible como código abierto en la plataforma HuggingFace, permitiendo a los usuarios experimentar directamente con él. Durante su entrenamiento, Stable Audio Open se alimentó de más de 486,000 muestras de bibliotecas musicales como FreeSound y Free Music Archive, asegurando una amplia cobertura de estilos y géneros en el audio generado.

Es importante destacar que, aunque Stable Audio Open se destaca en la creación de clips musicales cortos de alta calidad, no está diseñado para generar canciones completas, melodías o pistas vocales. Su propósito es ser una herramienta rápida y versátil para la creación de audio, en lugar de reemplazar software profesional de producción musical.

Además, Stable Audio Open se diferencia del modelo comercial anterior de Stability AI, Stable Audio 2.0, que puede generar pistas de audio completas de hasta 3 minutos de duración, atendiendo una gama más amplia de necesidades de creación sonora. En cambio, Stable Audio Open se enfoca en fragmentos de audio cortos y efectos de sonido, ofreciendo a los usuarios mayor personalización y flexibilidad.

El lanzamiento de Stable Audio Open representa un avance significativo para Stability AI en el espacio de generación de audio. A medida que la tecnología de inteligencia artificial sigue evolucionando, esperamos ver más modelos innovadores y prácticos de generación de audio y sus aplicaciones.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles