Ein bahnbrechendes Open-Source-Sprachmodell hat nun den Titel des besten Modells der Welt beansprucht, wie die neuesten Ranglisten von Hugging Face, einer führenden Plattform für Forschung und Anwendungen im Bereich der Verarbeitung natürlicher Sprache (NLP), zeigen.
Das Modell mit dem Namen „Smaug-72B“ wurde heute von Abacus AI, einem Startup, das sich auf die Lösung komplexer Herausforderungen in der künstlichen Intelligenz und dem maschinellen Lernen konzentriert, öffentlich veröffentlicht. Smaug-72B ist eine fein abgestimmte Version von „Qwen-72B“, einem weiteren herausragenden Sprachmodell, das vor wenigen Monaten von einem Forschungsteam der Alibaba Group vorgestellt wurde.
Bemerkenswert ist, dass Smaug-72B OpenAIs GPT-3.5 und Mistral Medium – zwei der fortschrittlichsten proprietären Sprachmodelle – in mehreren wichtigen Benchmarks übertrifft. Außerdem übertrifft es Qwen-72B in vielen Bewertungen erheblich.
Laut der Hugging Face Open LLM-Leistungsübersicht, die die Leistung von Open-Source-Sprachmodellen bei verschiedenen Aufgaben der natürlichen Sprache bewertet, ist Smaug-72B nun das erste und einzige Open-Source-Modell, das in allen wichtigen Bewertungen einen Durchschnittswert von über 80 erreicht. Obwohl es noch nicht die 90-100 Punkten erreicht hat, die auf menschliches Niveau hinweisen, signalisiert seine Veröffentlichung eine potenzielle Wende im Bereich der Open-Source-KI und deutet darauf hin, dass es bald mit den Fähigkeiten großer Technologieunternehmen konkurrieren könnte, die lange als unzugänglich galten.
Der Vorteil von Open-Source
„Smaug-72B von Abacus AI führt nun die LLM-Leistungsübersicht als erstes Modell mit einem Durchschnittswert von 80 an“, sagte Abacus AI-CEO Bindu Reddy in einem Beitrag auf X.com. „Unser nächstes Ziel ist es, diese Techniken in einem Forschungsbericht zu veröffentlichen und sie auf die Top-Mistral-Modelle anzuwenden, einschließlich Miqu, einer 70B fein abgestimmten Version von LLama-2. Die verwendeten Techniken zielen speziell auf Denk- und mathematische Fähigkeiten ab, was die beeindruckenden GSM8K-Ergebnisse erklärt! Weitere Einblicke werden in unserem kommenden Bericht geteilt.“
Seit seiner Veröffentlichung zeichnet sich Smaug-72B nicht nur durch seine Gesamtleistung aus, sondern auch durch seine außergewöhnlichen Fähigkeiten in den Bereichen Denken und Mathematik – verstärkt durch die spezifischen Feinabstimmungstechniken von Abacus AI, die häufige Schwächen großer Sprachmodelle adressieren und die Leistung verbessern.
Zu weiteren bemerkenswerten Open-Source-Entwicklungen gehört Qwen 1.5, eine Suite kleiner, aber leistungsstarker Sprachmodelle mit 0,5B bis 72B Parametern, die von Qwen veröffentlicht wurden. Qwen 1.5 übertrifft beliebte proprietäre Modelle wie Mistral Medium und GPT-3.5, bietet eine Kontextlänge von 32k und Kompatibilität mit verschiedenen Werkzeugen für eine schnelle lokale Inferenz. Darüber hinaus hat Qwen Qwen-VL-Max eingeführt, ein neues großes visuelles Sprachmodell, das mit Googles Gemini Ultra und OpenAIs GPT-4V konkurriert.
Auswirkungen auf die Zukunft der KI
Der Aufstieg von Smaug-72B und Qwen 1.5 hat sowohl in der KI-Community als auch in breiteren Technologiekreisen für Aufregung und Diskussionen gesorgt. Viele Experten haben die Beiträge von Abacus AI und Qwen zur Open-Source-KI gelobt und die rasanten Fortschritte des letzten Jahres hervorgehoben.
„Es ist unglaublich, sich vorzustellen, dass wir vor weniger als einem Jahr von Modellen wie Dolly begeistert waren“, bemerkte Sahar Mor, eine KI-Influencerin und Analystin, auf LinkedIn und reflektierte darüber, wie schnell sich Open-Source-Modelle entwickelt haben.
Sowohl Smaug-72B als auch Qwen 1.5 sind öffentlich auf Hugging Face zugänglich, sodass Benutzer sie nach Belieben herunterladen, nutzen und modifizieren können. Abacus AI und Qwen haben außerdem angekündigt, ihre Modelle in die llmsys Humanevaluierung einzureichen – ein neuer Maßstab zur Messung der Leistung von Sprachmodellen in menschenähnlichen Aufgaben. Sie deuteten auf zukünftige Projekte hin, die darauf abzielen, weitere Open-Source-Modelle zu entwickeln und verschiedene Anwendungen zu erkunden.
Smaug-72B und Qwen 1.5 verkörpern die rasante Weiterentwicklung der Open-Source-KI in den letzten Monaten. Sie stehen für eine transformative Welle von Innovation und Demokratisierung, die die Dominanz großer Technologieunternehmen in Frage stellt und neue Chancen für Entwickler und Forscher schafft. Während die Zukunft der Führungsposition von Smaug-72B auf der Hugging Face-Leistungsübersicht abzuwarten bleibt, ist klar, dass die Open-Source-KI erheblich an Dynamik gewinnt.