Stable Audio Open: Новый Выбор для Создания Аудио с Открытой Моделью Генерации Звука от Stable AI

Недавно Stability AI представила революционную модель открытого кода под названием Stable Audio Open, которая расширяет известную технологию Stable Diffusion для текстов и изображений в аудиосферу. Эта модель генерирует высококачественные и разнообразные аудиосэмплы на основе предоставленных пользователем запросов, вдохновляя новые подходы в музыкальной композиции и звуковом дизайне.

Stable Audio Open использует трансформерную диффузионную модель (DiT) для создания аудио в латентном пространстве автоэнкодера, что значительно улучшает качество и разнообразие создаваемых звуков. Она может генерировать музыкальные клипы длиной до 47 секунд, что делает её идеальной для таких приложений, как ритмы ударных, инструментальные мелодии, амбиентные звуки и звуковые эффекты.

Модель теперь доступна в открытом доступе на платформе HuggingFace, что позволяет пользователям экспериментировать с ней напрямую. В процессе обучения Stable Audio Open была использована более 486,000 сэмплов из музыкальных библиотек, таких как FreeSound и Free Music Archive, что обеспечивает широкий охват стилей и жанров в создаваемом аудио.

Важно отметить, что хотя Stable Audio Open превосходно генерирует высококачественные короткие музыкальные клипы, она не предназначена для создания полноценных песен, мелодий или вокальных треков. Модель разработана как быстрый и универсальный инструмент для создания аудио, а не как замена профессиональному программному обеспечению для музыкального производства.

Кроме того, Stable Audio Open отличается от коммерческой модели Stability AI, Stable Audio 2.0, которая может создавать полные аудиотреки длиной до 3 минут для удовлетворения более широких потребностей в создании аудио. В отличие от этого, Stable Audio Open сосредотачивается на коротких аудиосниппетах и звуковых эффектах, предлагая пользователям большую настройку и гибкость.

Выход Stable Audio Open знаменует собой значительный шаг вперёд для Stability AI в области генерации аудио. По мере того как технологии искусственного интеллекта продолжают развиваться, мы с нетерпением ждём появления новых инновационных и практичных моделей генерации аудио и их применения.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles