Stable Audio Open: Eine neue Wahl für die Audioproduktion mit dem Open-Source-Audio-Generierungsmodell von Stable AI.

Home KI-Nachrichten Stable Audio Open: Eine neue Wahl für die Audioproduktion mit dem Open-Source-Audio-Generierungsmodell von Stable AI.

Kürzlich hat Stability AI ein bahnbrechendes Open-Source-AI-Modell namens Stable Audio Open lanciert, das die renommierte Text-zu-Bild-Technologie Stable Diffusion in den Audiobereich erweitert. Dieses Modell erzeugt hochwertige und vielfältige Audio-Samples basierend auf benutzerdefinierten Eingaben und belebt die Musikkomposition sowie das Sounddesign neu.

Stable Audio Open verwendet ein transformerbasiertes Diffusionsmodell (DiT), um Audio im latenten Raum eines Autoencoders zu erstellen, was die Qualität und Vielfalt der erzeugten Klänge erheblich verbessert. Es ist in der Lage, Musikclips von bis zu 47 Sekunden zu produzieren, was es ideal für verschiedene Anwendungen wie Schlagzeugrhythmen, instrumentale Melodien, ambient Sounds und Soundeffekte macht.

Das Modell ist jetzt offiziell als Open Source auf der HuggingFace-Plattform verfügbar, sodass Nutzer direkt damit experimentieren können. Während des Trainings erhielt Stable Audio Open über 486.000 Samples aus Musikbibliotheken wie FreeSound und Free Music Archive, was eine breite Abdeckung von Stilrichtungen und Genres in den generierten Audios gewährleistet.

Es ist wichtig zu beachten, dass Stable Audio Open zwar exzellente kurze Musikclips erzeugt, jedoch nicht für die Erstellung vollständiger Songs, Melodien oder Gesangsspuren gedacht ist. Das Modell dient als schnelles und vielseitiges Werkzeug zur Audioerstellung und ist nicht als Ersatz für professionelle Musikproduktionssoftware konzipiert.

Zusätzlich unterscheidet sich Stable Audio Open von Stability AIs vorherigem kommerziellen Modell, Stable Audio 2.0, das vollständige Audiotracks von bis zu 3 Minuten Länge generieren kann und somit ein breiteres Spektrum an Audioerstellungsbedürfnissen abdeckt. Im Gegensatz dazu konzentriert sich Stable Audio Open auf kurze Audio-Schnipsel und Soundeffekte und bietet den Nutzern somit größere Anpassungsmöglichkeiten und Flexibilität.

Die Veröffentlichung von Stable Audio Open stellt einen bedeutenden Fortschritt für Stability AI im Bereich der Audio-Generierung dar. Während sich die Technologie der künstlichen Intelligenz weiterentwickelt, freuen wir uns darauf, weitere innovative und praktische Modelle zur Audio-Generierung und deren Anwendungen zu erleben.

USA eröffnet Antitrust-Untersuchung zu den KI-Praktiken von Microsoft, OpenAI und Nvidia

Das Gleichgewicht finden: Die Kontroversen um den Datenschutz von iOS 18 im Kontext von KI-Funktionen meistern

Most people like

Automagical Apps

48.1K

Entdecken Sie die besten Produktivitäts-Apps für Google Workspace und unverzichtbare Chrome-Erweiterungen, die von über 3 Millionen Nutzern vertraut sind, um die Effizienz zu steigern und Arbeitsabläufe zu optimieren.

Produktivität AI App Builder

WeShop

173.6K

Entfalten Sie das Potenzial der KI mit unserer innovativen Plattform zur Erstellung atemberaubender, hochwertiger Bilder. Egal, ob Sie Designer, Marketer oder einfach jemand sind, der beeindruckende Visuals benötigt – unsere KI-gesteuerte Technologie ermöglicht es Ihnen, mühelos professionelle Bilder zu erstellen. Entdecken Sie, wie Sie Ihre Projekte in nur wenigen Augenblicken aufwerten können!

KI-Studio AI Advertising Assistant

Quivr

24K

Präsentieren Sie Quivr, eine hochmoderne Cloud-Plattform, die für die effiziente Speicherung und den Abruf einer Vielzahl von Datentypen entwickelt wurde. Egal, ob Sie Texte, Bilder oder komplexe Datensätze verwalten, Quivr bietet eine nahtlose Lösung, die auf Ihre Datenverwaltungsbedürfnisse zugeschnitten ist. Erleben Sie heute mit Quivr unvergleichliche Zugänglichkeit und Organisation!

cloudbasierte Plattform Other

PartyRock

167.5K

Erstellen Sie mühelos KI-Anwendungen und entdecken Sie die faszinierende Welt der generativen KI mit PartyRock.

KI-Apps AI App Builder

Find AI tools in YBX