Einführung von 'Smaug-72B': Der unangefochtene Champion der Open-Source KI-Lösungen

Home KI-Nachrichten Einführung von 'Smaug-72B': Der unangefochtene Champion der Open-Source KI-Lösungen

Updated on Oktober 30 2024

Ein bahnbrechendes Open-Source-Sprachmodell hat nun den Titel des besten Modells der Welt beansprucht, wie die neuesten Ranglisten von Hugging Face, einer führenden Plattform für Forschung und Anwendungen im Bereich der Verarbeitung natürlicher Sprache (NLP), zeigen.

Das Modell mit dem Namen „Smaug-72B“ wurde heute von Abacus AI, einem Startup, das sich auf die Lösung komplexer Herausforderungen in der künstlichen Intelligenz und dem maschinellen Lernen konzentriert, öffentlich veröffentlicht. Smaug-72B ist eine fein abgestimmte Version von „Qwen-72B“, einem weiteren herausragenden Sprachmodell, das vor wenigen Monaten von einem Forschungsteam der Alibaba Group vorgestellt wurde.

Bemerkenswert ist, dass Smaug-72B OpenAIs GPT-3.5 und Mistral Medium – zwei der fortschrittlichsten proprietären Sprachmodelle – in mehreren wichtigen Benchmarks übertrifft. Außerdem übertrifft es Qwen-72B in vielen Bewertungen erheblich.

Laut der Hugging Face Open LLM-Leistungsübersicht, die die Leistung von Open-Source-Sprachmodellen bei verschiedenen Aufgaben der natürlichen Sprache bewertet, ist Smaug-72B nun das erste und einzige Open-Source-Modell, das in allen wichtigen Bewertungen einen Durchschnittswert von über 80 erreicht. Obwohl es noch nicht die 90-100 Punkten erreicht hat, die auf menschliches Niveau hinweisen, signalisiert seine Veröffentlichung eine potenzielle Wende im Bereich der Open-Source-KI und deutet darauf hin, dass es bald mit den Fähigkeiten großer Technologieunternehmen konkurrieren könnte, die lange als unzugänglich galten.

Der Vorteil von Open-Source

„Smaug-72B von Abacus AI führt nun die LLM-Leistungsübersicht als erstes Modell mit einem Durchschnittswert von 80 an“, sagte Abacus AI-CEO Bindu Reddy in einem Beitrag auf X.com. „Unser nächstes Ziel ist es, diese Techniken in einem Forschungsbericht zu veröffentlichen und sie auf die Top-Mistral-Modelle anzuwenden, einschließlich Miqu, einer 70B fein abgestimmten Version von LLama-2. Die verwendeten Techniken zielen speziell auf Denk- und mathematische Fähigkeiten ab, was die beeindruckenden GSM8K-Ergebnisse erklärt! Weitere Einblicke werden in unserem kommenden Bericht geteilt.“

Seit seiner Veröffentlichung zeichnet sich Smaug-72B nicht nur durch seine Gesamtleistung aus, sondern auch durch seine außergewöhnlichen Fähigkeiten in den Bereichen Denken und Mathematik – verstärkt durch die spezifischen Feinabstimmungstechniken von Abacus AI, die häufige Schwächen großer Sprachmodelle adressieren und die Leistung verbessern.

Zu weiteren bemerkenswerten Open-Source-Entwicklungen gehört Qwen 1.5, eine Suite kleiner, aber leistungsstarker Sprachmodelle mit 0,5B bis 72B Parametern, die von Qwen veröffentlicht wurden. Qwen 1.5 übertrifft beliebte proprietäre Modelle wie Mistral Medium und GPT-3.5, bietet eine Kontextlänge von 32k und Kompatibilität mit verschiedenen Werkzeugen für eine schnelle lokale Inferenz. Darüber hinaus hat Qwen Qwen-VL-Max eingeführt, ein neues großes visuelles Sprachmodell, das mit Googles Gemini Ultra und OpenAIs GPT-4V konkurriert.

Auswirkungen auf die Zukunft der KI

Der Aufstieg von Smaug-72B und Qwen 1.5 hat sowohl in der KI-Community als auch in breiteren Technologiekreisen für Aufregung und Diskussionen gesorgt. Viele Experten haben die Beiträge von Abacus AI und Qwen zur Open-Source-KI gelobt und die rasanten Fortschritte des letzten Jahres hervorgehoben.

„Es ist unglaublich, sich vorzustellen, dass wir vor weniger als einem Jahr von Modellen wie Dolly begeistert waren“, bemerkte Sahar Mor, eine KI-Influencerin und Analystin, auf LinkedIn und reflektierte darüber, wie schnell sich Open-Source-Modelle entwickelt haben.

Sowohl Smaug-72B als auch Qwen 1.5 sind öffentlich auf Hugging Face zugänglich, sodass Benutzer sie nach Belieben herunterladen, nutzen und modifizieren können. Abacus AI und Qwen haben außerdem angekündigt, ihre Modelle in die llmsys Humanevaluierung einzureichen – ein neuer Maßstab zur Messung der Leistung von Sprachmodellen in menschenähnlichen Aufgaben. Sie deuteten auf zukünftige Projekte hin, die darauf abzielen, weitere Open-Source-Modelle zu entwickeln und verschiedene Anwendungen zu erkunden.

Smaug-72B und Qwen 1.5 verkörpern die rasante Weiterentwicklung der Open-Source-KI in den letzten Monaten. Sie stehen für eine transformative Welle von Innovation und Demokratisierung, die die Dominanz großer Technologieunternehmen in Frage stellt und neue Chancen für Entwickler und Forscher schafft. Während die Zukunft der Führungsposition von Smaug-72B auf der Hugging Face-Leistungsübersicht abzuwarten bleibt, ist klar, dass die Open-Source-KI erheblich an Dynamik gewinnt.

Wann man ART nutzen sollte: IBM's Adversarial Robustness Toolbox für KI-Lösungen einsetzen

OpenAI kooperiert mit Meta zur Kennzeichnung von KI-generierten Bildern für mehr Transparenz

Most people like

Education Copilot

32.3K

Education Copilot ist eine innovative KI-Plattform, die darauf abzielt, Lehrenden die Unterrichtsplanung zu erleichtern. Durch den Einsatz fortschrittlicher Technologie ermöglicht sie Lehrern, ansprechende und effektive Unterrichtseinheiten gezielt auf die Bedürfnisse ihrer Schüler zu erstellen.

KI-Stundenpläne AI Education Assistant

Babe Chat AI

102.9K

In der heutigen schnelllebigen digitalen Landschaft verändert Künstliche Intelligenz (KI) die Art und Weise, wie wir uns verbinden und kreieren. Durch die Steigerung der digitalen Intimität fördern KI-Werkzeuge tiefere Beziehungen und ermöglichen bedeutungsvolle Interaktionen über verschiedene Plattformen hinweg. Gleichzeitig versetzen diese Innovationen die Nutzer in die Lage, beeindruckende visuelle Inhalte zu erstellen, die das Publikum fesseln. Entdecken Sie, wie KI sowohl persönliche Verbindungen als auch kreative Ausdrucksformen im digitalen Raum transformiert.

KI-Chatbot AI Chatbot

Lovable-GPT Engineer

29.6K

Entdecken Sie ein innovatives KI-Tool, das für den mühelosen Aufbau und die Bereitstellung von Webanwendungen durch interaktive Gespräche entwickelt wurde. Diese benutzerfreundliche Lösung nutzt die Kraft der künstlichen Intelligenz, um Ihren Webentwicklungsprozess zu optimieren und ihn sowohl für Anfänger als auch für erfahrene Entwickler zugänglich zu machen. Führen Sie einen intuitiven Dialog, der Ihre Ideen mühelos in voll funktionsfähige Anwendungen verwandelt.

KI-Softwareentwickler AI Website Designer

Mercor

146.8K

Präsentation unserer fortschrittlichen KI-Plattform, die speziell für die nahtlose Beschaffung, Überprüfung und Bezahlung von Mitarbeitern entwickelt wurde. Optimieren Sie Ihren Einstellungsprozess mit modernster Technologie, die die Rekrutierung vereinfacht und Ihnen hilft, die richtigen Talente effizient und mühelos zu finden. Mit unseren innovativen Lösungen war das Management von Mitarbeiterzahlungen noch nie so einfach, sodass Ihr Unternehmen in einem wettbewerbsintensiven Umfeld florieren kann.

KI-Einstellungsplattform AI Interview Assistant

Find AI tools in YBX