Stability AI startet 'Smol'-Modell: Vorstellung von StableLM Zephyr 3B

Home KI-Nachrichten Stability AI startet 'Smol'-Modell: Vorstellung von StableLM Zephyr 3B

Updated on Dezember 7 2023

Stability AI hat sich vor allem durch ihre innovative Suite von Text-zu-Bild-generierenden KI-Modellen einen Namen gemacht, doch das Unternehmen erweitert nun sein Angebot.

Heute stellte Stability AI den neuesten Fortschritt vor: StableLM Zephyr 3B. Dieses Modell ist ein großes Sprachmodell (LLM) mit 3 Milliarden Parametern, das für verschiedene Chat-Anwendungen wie Textgenerierung, Zusammenfassungen und Inhaltsanpassung entwickelt wurde. StableLM Zephyr 3B ist eine optimierte, kleinere Version des ursprünglich in diesem Jahr eingeführten StableLM-Modells zur Textgenerierung.

Ein entscheidender Vorteil von StableLM Zephyr 3B liegt in seiner Größe. Durch die geringere Größe im Vergleich zu den 7 Milliarden Parameter-Versionen von StableLM kann es auf einer breiteren Hardwarepalette mit verringertem Ressourcenbedarf eingesetzt werden, während es schnelle Antworten liefert. Das Modell wurde speziell für Fragebeantwortung und instruktive Aufgaben optimiert.

„StableLM wurde länger mit hochwertigeren Daten trainiert als frühere Modelle und verwendet doppelt so viele Tokens wie LLaMA v2 7b, erreicht jedoch die Basisleistung dieses Modells bei nur 40 % der Größe“, erklärte Emad Mostaque, CEO von Stability AI.

Die Einführung von StableLM Zephyr 3B

StableLM Zephyr 3B ist kein gänzlich neues Modell, sondern eine Erweiterung des bestehenden StableLM 3B-4e1t-Modells. Sein Design basiert auf dem Zephyr 7B-Modell von HuggingFace, das unter einer Open-Source-MIT-Lizenz betrieben wird und als Assistent gedacht ist. Zephyr nutzt eine Trainingsmethode namens Direct Preference Optimization (DPO), die auch in StableLM Anwendung findet.

Mostaque erläuterte, dass DPO eine Alternative zu den Verstärkungslernen-Techniken früherer Modelle darstellt und diese verfeinert, um besser auf menschliche Präferenzen einzugehen. Während DPO normalerweise bei größeren Modellen angewendet wird, ist StableLM Zephyr eines der ersten Beispiele für diese Methode in einem kleineren 3 Milliarden Parameter-Modell.

Stability AI hat DPO in Kombination mit dem UltraFeedback-Datensatz der OpenBMB-Forschungsgruppe verwendet, der mehr als 64.000 Eingabeaufforderungen und 256.000 Antworten umfasst. Diese Kombination aus DPO, der Modellgröße und dem optimierten Trainingsdatensatz führt zu beeindruckenden Leistungskennzahlen. So übertraf StableLM Zephyr 3B in der MT Bench-Bewertung größere Modelle wie Meta's Llama-2-70b-chat und Anthropic's Claude-V1.

Ein wachsendes Portfolio von Modellen

StableLM Zephyr 3B trägt zu einem wachsenden Portfolio von Modellen bei, das Stability AI als KI-Startup fortlaufend erweitert. Im August launchte das Unternehmen StableCode zur Anwendungsentwicklung, gefolgt von Stable Audio im September für die Text-zu-Audio-Generierung. Im November gab es einen Vorgeschmack auf Stable Video Diffusion, was Stability AIs Eintritt in die Videogenerierung markiert.

Trotz dieser Expansion hält Stability AI an seinen Wurzeln in der Text-zu-Bild-Generierung fest. Kürzlich stellte das Unternehmen SDXL Turbo vor, eine schnellere Version seines Flaggschiffmodells SDXL für Text-zu-Bild stabile Diffusion.

Mostaque betont, dass noch viel Innovation von Stability AI zu erwarten ist. „Wir glauben, dass kleine, offene, leistungsfähige Modelle, die auf spezifische Nutzerdaten zugeschnitten sind, größere allgemeine Modelle übertreffen werden“, erklärte er. „Mit der bevorstehenden vollständigen Veröffentlichung unserer neuen StableLM-Modelle freuen wir uns darauf, generative Sprachmodelle weiter zu demokratisieren.“

Mine sichert sich eine Investition von 30 Millionen USD zur Bereitstellung von KI-gesteuerten Datenschutzlösungen für Unternehmen.

Cisco Setzt Vollständig Auf KI zur Verbesserung seiner Cybersicherheitsstrategie

Most people like

ScoreApp

488.3K

Gewinnen Sie hochwertige Leads, sammeln Sie wertvolle Erkenntnisse und steigern Sie Ihren Umsatz.

Quiz-Trichter-Marketing AI Lead Generation

Minutes AI

Revolutionieren Sie Ihr Meeting-Management mit unserem automatisierten KI-Tool, das Audiodaten mühelos in klare und prägnante Sitzungsprotokolle umwandelt. Erleben Sie nahtlose Dokumentation und verpassen Sie nie wieder ein Detail!

Notizen machen AI Meeting Assistant

Artiphoria

48.3K

Präsentieren Sie Artiphoria, die innovative KI-Software, mit der Sie mit nur einem Klick unzählige individuelle Bilder erstellen können. Entfalten Sie Ihre Kreativität und verwandeln Sie Ideen mühelos in beeindruckende visuelle Darstellungen!

KI AI Art Generator

Vast.ai

408.9K

Erschwingliche Cloud-GPU-Mietplattform für optimale Leistung In der heutigen digitalen Landschaft ist die Nachfrage nach leistungsstarken Computerressourcen in die Höhe geschnellt, was Cloud-GPU-Mieten zu einer attraktiven Option für Unternehmen und Entwickler macht. Unsere Plattform bietet eine kostengünstige Lösung für den Zugriff auf leistungsstarke GPU-Funktionen, sodass Sie Ihre Projekte verbessern können, ohne die hohen Kosten, die normalerweise mit traditioneller Hardware verbunden sind. Erleben Sie nahtlose Skalierbarkeit und Flexibilität mit unseren kostengünstigen Cloud-GPU-Mieten, die auf Ihre spezifischen Bedürfnisse zugeschnitten sind und Ihre Produktivität steigern.

Cloud-GPU-Vermietung Other

Find AI tools in YBX