Meta stellt neue KI-Modelle für Audio, Text und Wasserzeichen-Innovationen vor.

Home KI-Nachrichten Meta stellt neue KI-Modelle für Audio, Text und Wasserzeichen-Innovationen vor.

Meta's Fundamental AI Research (FAIR) Team präsentiert neue KI-Modelle und Werkzeuge für Forscher, die sich auf Audiogenerierung, Text-zu-Visuellen-Funktionen und Wasserzeichen-Technologien konzentrieren. In einer Pressemitteilung erklärte das Unternehmen: „Durch die öffentliche Präsentation unserer frühen Forschung möchten wir Innovationen inspirieren und KI verantwortungsvoll vorantreiben.“

Audiomodell: JASCO und Wasserzeichenwerkzeuge

Meta führt JASCO ein, was für Joint Audio and Symbolic Conditioning for Temporally Controlled Text-to-Music Generation steht. Dieses Modell verbessert die Audiogenerierung, da Benutzer verschiedene Elemente wie Akkorde oder Beats eingeben können, um das Endergebnis zu verfeinern. Die Forschung von FAIR zeigt, dass JASCO es Nutzern ermöglicht, Charakteristika des erzeugten Audios – wie Akkorde, Drums und Melodien – durch Textbefehle zu manipulieren und so den gewünschten Klang zu erzeugen.

Der JASCO-Inferenzcode wird im Rahmen der AudioCraft-KI-Audiomodellebibliothek unter einer MIT-Lizenz veröffentlicht, während das vortrainierte Modell unter einer nicht-kommerziellen Creative Commons-Lizenz erhältlich sein wird. Darüber hinaus lanciert Meta AudioSeal, ein innovatives Werkzeug, das KI-generierte Sprache mit Wasserzeichen versieht und so die Identifikation solcher Inhalte erleichtert.

Meta betont: „AudioSeal ist die erste Audio-Wasserzeichen-Technik, die speziell für die lokale Erkennung von KI-generierter Sprache entwickelt wurde und die Identifizierung von KI-erstellten Segmenten innerhalb längerer Audiodateien ermöglicht.“ Dieses Werkzeug steigert die Erkennungseffizienz und erhöht die Geschwindigkeit um das 485-Fache im Vergleich zu herkömmlichen Methoden. Im Gegensatz zu anderen Modellen wird AudioSeal unter einer kommerziellen Lizenz veröffentlicht.

Veröffentlichung des Chameleon-Modells

FAIR plant außerdem die Veröffentlichung von zwei Versionen seines multimodalen Textmodells, Chameleon, unter einer Forschungs-lizenz. Die Modelle Chameleon 7B und 34B sind für Aufgaben konzipiert, die visuelles und textliches Verständnis erfordern, wie z.B. die Bildbeschriftung. Meta hat jedoch angekündigt, dass das Chameleon-Modell zur Bilderzeugung derzeit nicht verfügbar sein wird, sodass der Zugang auf die textbezogenen Funktionen beschränkt bleibt.

Darüber hinaus erhalten Forscher Zugang zu einer Multi-Token-Prädiktionsmethode, die Sprachmodelle auf mehrere zukünftige Wörter gleichzeitig trainiert und nicht sequenziell. Dieses Feature wird ausschließlich unter einer nicht-kommerziellen und forschungsbasierten Lizenz zugänglich sein.

Entdecken Sie Maxim: Ihre umfassende Bewertungsplattform zur Bewältigung von KI-Qualitätsherausforderungen.

Decagon präsentiert ‘menschliche’ KI-Agenten zur Revolutionierung des Unternehmens-Kundensupports nach geheimen Vorbereitungen.

Most people like

Quillbot

76.1M

Transformieren Sie Ihr Schreiben mühelos mit diesem leistungsstarken Online-Textumformungstool. Ganz gleich, ob Sie einen Artikel neu formulieren, die Klarheit verbessern oder frische Inhalte erstellen möchten – unsere benutzerfreundliche Plattform macht das Umschreiben zum Kinderspiel. Ideal für Studenten, Profis und Content-Ersteller, hebt dieses Tool Ihr Schreiben hervor und bewahrt dabei die ursprüngliche Bedeutung. Entdecken Sie noch heute, wie einfach es ist, Ihren Text zu verbessern!

Textüberarbeitung AI Rewriter

UChat

26.8K

UChat ist eine innovative Chatbot-Plattform, die es Unternehmen ermöglicht, ihre Abläufe mühelos zu automatisieren, ganz ohne Programmierkenntnisse.

Chatbot-Plattform AI Chatbot

Neurelo

24.5K

In der heutigen, datengetriebenen Welt revolutionieren KI-gesteuerte Datenbank-APIs, wie Unternehmen mit ihren Daten interagieren und diese verwalten. Durch den Einsatz künstlicher Intelligenz optimieren diese APIs die Datenabfrage, erhöhen die Genauigkeit und ermöglichen intelligentere Entscheidungsprozesse. Ideal für Entwickler und Unternehmen, optimieren KI-basierte Datenbank-APIs nicht nur die Leistung, sondern fördern auch Innovation, indem sie es Organisationen ermöglichen, das volle Potenzial ihrer Daten zu nutzen. Entdecken Sie die transformative Wirkung von KI-gesteuerten Datenbank-APIs und wie sie Ihre Datenmanagement-Strategien verbessern können.

Datenbank AI Lead Generation

Unthread - AI Support in Slack

36.5K

Unthread ist ein leistungsstarkes Automatisierungstool, das entwickelt wurde, um den Kundenservice in Slack zu verbessern. Es bietet eine Vielzahl wesentlicher Funktionen für eine reibungslose Kommunikation und Effizienz.

KI-Unterstützung AI Customer Service Assistant

Find AI tools in YBX