In einem exklusiven Interview enthüllte Itamar Arel, Gründer und CEO des KI-Startups Tenyx, einen bemerkenswerten Fortschritt in der Verarbeitung natürlicher Sprache. Tenyx hat das Open-Source-Sprachmodell Llama-3 von Meta, das jetzt Tenyx-70B heißt, so optimiert, dass es in bestimmten Bereichen OpenAIs GPT-4 übertrifft – ein Novum für ein Open-Source-Modell, das den proprietären Standard übersteigt.
„Wir haben eine Feinabstimmungstechnologie entwickelt, die es uns ermöglicht, ein grundlegendes Modell über das ursprüngliche Training hinaus zu verbessern“, erklärte Arel. „Wir sind begeistert davon, diesen Ansatz zu nutzen, um kontinuierliches oder inkrementelles Lernen zu ermöglichen, indem wir Redundanzen in großen Modellen nutzen.“
Das Llama-3-Modell von Tenyx übertrifft GPT-4 in Mathematik und Programmierung und bietet darüber hinaus verbesserte Funktionen im Vergleich zum Basismodell Llama-3. Dieser Erfolg, so Arel, markiert den Beginn einer neuen Ära für Open-Source-KI.
Bewältigung des Problems des "katastrophalen Vergessens"
Tenyx geht das Problem des "katastrophalen Vergessens" an, bei dem ein Modell zuvor erlerntes Wissen verliert, wenn es neuen Daten ausgesetzt wird. Durch die selektive Aktualisierung eines kleinen Teils der Modellparameter kann Tenyx effektiv mit neuen Informationen trainieren, ohne bestehende Fähigkeiten zu opfern.
„Wenn Sie nur 5% der Modellparameter ändern und den Rest intakt lassen, können Sie dies aggressiver durchführen, ohne andere Funktionen zu verzerren“, bemerkte Arel. Diese Methode ermöglicht es Tenyx, das 70 Milliarden Parameter umfassende Llama-3-Modell in nur 15 Stunden mit 100 GPUs anzupassen.
Engagement für Open-Source-KI
Tenyx setzt sich für Open-Source-KI ein, indem sie ihr optimiertes Modell Tenyx-70B unter derselben Lizenz wie das ursprüngliche Llama-3 veröffentlichen. „Wir glauben an Open-Source-Modelle“, erklärte Arel. „Die Fortschritte mit der Gemeinschaft zu teilen, fördert Innovationen und kommt allen zugute.“
Die Anwendungen von Tenyx' Optimierungstechnik nach dem Training sind vielfältig, von der Entwicklung spezialisierter Chatbots bis hin zur häufigen Aktualisierung eingesetzter Modelle, um sicherzustellen, dass sie mit neuen Informationen Schritt halten.
Neugestaltung der KI-Landschaft
Tenyx’ Durchbruch hat erhebliche Auswirkungen und bietet Unternehmen und Forschern Zugang zu fortschrittlichen Sprachmodellen ohne die hohen Kosten proprietärer Lösungen. Dieser Fortschritt könnte auch weitere Innovationen in der Open-Source-Community entfachen, während andere auf Tenyx‘ Erfolg aufbauen.
„Was bedeutet das für die Branche und Unternehmen wie OpenAI?“ fragte Arel nachdenklich. Angesichts des zunehmenden Wettbewerbs im KI-Sektor könnte Tenyx’ Feinabstimmung von Open-Source-Modellen die Dynamik der Branche und die Herangehensweise der Unternehmen an die Verarbeitung natürlicher Sprache neu definieren.
Obwohl das für Tenyx optimierte Llama-3 einige Einschränkungen des Basismodells beibehält – darunter gelegentlich unlogische Antworten – sind seine Verbesserungen bemerkenswert. Arel berichtete, dass das Modell eine Genauigkeit von fast 96% in Mathematik und Logik erreicht, im Vergleich zu 85% beim Basismodell.
Während Tenyx eine neue Welle der Innovation in Open-Source-KI einleitet, bleibt die langfristige Auswirkung ihres Durchbruchs auf das KI-Ökosystem abzuwarten. Es ist jedoch offensichtlich, dass Tenyx bewiesen hat, dass Open-Source-Modelle mit ihren proprietären Pendants konkurrieren und diese sogar übertreffen können, und damit den Weg für eine zugängliche und kollaborative Zukunft in der künstlichen Intelligenz ebnet.