Microsoft und Beihang präsentieren MoRA: Eine neuartige Technik für effizientes Feintuning von LLMs.

Home KI-Nachrichten Microsoft und Beihang präsentieren MoRA: Eine neuartige Technik für effizientes Feintuning von LLMs.

Forscher von Microsoft und der Beihang-Universität haben eine kostengünstige Methode zur Feinabstimmung großer Sprachmodelle (LLMs) entwickelt, die die üblichen Kosten erheblich senkt. Diese neuartige parameter-effiziente Feinabstimmungsmethode (PEFT) trägt den Namen MoRA und beseitigt die Einschränkungen, die häufig mit vorhandenen Techniken wie der Low-Rank-Anpassung (LoRA) verbunden sind. MoRA ist besonders vorteilhaft, wenn es darum geht, Modelle für Aufgaben zu optimieren, die neues Wissen erfordern. In Unternehmen, in denen PEFT-Strategien an Bedeutung gewinnen, stellt MoRA ein wertvolles Werkzeug für Entwickler von LLM-Anwendungen dar.

Verständnis von PEFT und LoRA

Bei der traditionellen Feinabstimmung müssen alle Parameter eines LLM angepasst werden, was aufgrund der oft Milliarden von Parametern hohen Kosten und Zeitaufwand verursacht. PEFT-Techniken optimieren diesen Prozess, indem sie die minimalen Parameter identifizieren, die für aufgabenspezifische Anpassungen erforderlich sind. LoRA hat sich als beliebte PEFT-Methode etabliert, da sie Parameter mit Hilfe von Low-Rank-Matrizen aktualisiert, was den Speicherbedarf reduziert und die Speicherung sowie den Einsatz feinabgestimmter Modelle erleichtert. Allerdings hat LoRA Schwierigkeiten bei komplexeren Aufgaben wie mathematischem Denken und fortlaufendem Pre-Training, da der Low-Rank-Ansatz die Fähigkeit des Modells einschränkt, neues Wissen zu erwerben und zu behalten. Laut den Forschern „beschränkt diese Einschränkung die Kapazität, neues Wissen durch Feinabstimmung zu speichern.“

Einführung von MoRA

MoRA verbessert LoRA, indem es auf eine einzelne quadratische Matrix statt auf Low-Rank-Matrizen setzt, was einen effizienteren Feinabstimmungsprozess ermöglicht. Das Hauptkonzept hinter MoRA besteht darin, trainierbare Parameter zu nutzen, um den höchstmöglichen Rang zu erreichen, der mit den ursprünglichen Dimensionen des Modells kompatibel ist. Im Gegensatz zu LoRA stimmen die Ein- und Ausgabedimensionen von MoRA nicht mit denen des ursprünglichen Modells überein, was eine einfache Matrizenmultiplikation verhindert. Um dies zu lösen, entwickelten die Forscher eine Kompressions-/Dekompressionsfunktion, die eine Transformation der Eingaben zwischen den beiden Räumen ermöglicht, wodurch MoRA nahtlos in LLMs verschiedener Größen integriert werden kann. Die quadratische Gewichtsmatrix erhöht MoRAs Fähigkeit, neues Wissen im Vergleich zu einem gleich großen LoRA-Modell zu lernen und zu speichern.

MoRAs Leistung

In Vergleichsstudien übertraf MoRA konstant LoRA bei Memorierungsaufgaben und erreichte nahezu die Leistung vollständig feinabgestimmter Modelle, während es weniger Parameter und Trainingsschritte benötigte. Die Forscher stellten fest, dass MoRAs Verlustkurve eng mit der vollständigen Feinabstimmung bei Wissensspeicheraufgaben übereinstimmt, was seine Effizienz belegt. „Unsere Methode zeigt signifikante Verbesserungen gegenüber LoRA bei gleicher Anzahl trainierbarer Parameter und profitiert von hochrangiger Aktualisierung“, erklärten sie. In Aufgaben der Anweisungseinstellung und mathematischen Begründung war MoRAs Leistung nahezu gleichwertig mit LoRA. Allerdings übertraf MoRA in kontinuierlichen Pre-Training-Szenarien im biomedizinischen und finanziellen Bereich aufgrund seiner hochrangigen Aktualisierungskapazität, die die Speicherung neuen Wissens erleichtert. Die Forscher wiesen auch darauf hin, dass die Erhöhung des Rangs des MoRA-Adapters die Leistungslücke zwischen PEFT und vollständiger Feinabstimmung bei mathematischen Begründungsaufgaben verringern könnte, jedoch mit höheren Anforderungen an Training und Speicherplatz.

Die Rolle von PEFT in Unternehmen

Die Feinabstimmung ist entscheidend für Unternehmensanwendungen von LLMs. Sie verbessert die Fähigkeiten und die Genauigkeit von LLMs, sodass Organisationen kleinere Modelle für Aufgaben nutzen können, die ansonsten aufwändigere Modelle erfordern würden. Derzeit gelten LoRA und deren Varianten als Maßstab für parameter-effiziente Feinabstimmung und werden von einem robusten Ökosystem von Tools und Plattformen unterstützt, die die Erstellung von LoRA-Adaptern ermöglichen. Beispielsweise ermöglicht S-LoRA Entwicklern die Ausführung mehrerer LoRA-Adapter auf einer einzigen GPU, was Anwendungen erleichtert, die zahlreiche fein abgestimmte LLMs benötigen, die auf individuelle Benutzerinhalte zugeschnitten sind. Die Forscher haben MoRA als Open-Source-Implementierung veröffentlicht, die mit LoRA kompatibel ist, und positionieren es als bedeutende Ressource für Unternehmen, die Basismodelle mit neuem Wissen anreichern möchten.

Elon Musk vs. Yann LeCun: Ein Social-Media-Konflikt, der gegensätzliche Ansätze in der KI-Forschung und der öffentlichen Wahrnehmung offenbart.

OpenAI startet Training für das nächste Modell – GPT-5 wird in weniger als 90 Tagen erwartet.

Most people like

Shmooz AI

29.2K

Shmooz AI ist ein innovativer KI-Assistent, der entwickelt wurde, um Ihre täglichen Aufgaben mit modernster Chat-GPT-Technologie zu optimieren. Erleben Sie gesteigerte Produktivität und Effizienz mit Shmooz AI, indem Sie Ihre täglichen Aktivitäten neu gestalten.

KI-Assistent AI Content Generator

Seasalt.ai

22.7K

Entdecken Sie eine hochmoderne Plattform für konversationelle KI, die fortschrittliche künstliche Intelligenz und modernste Spracherkennungstechnologie nutzt. Begeistern Sie Ihr Publikum wie nie zuvor mit unseren innovativen Lösungen, die darauf ausgelegt sind, die Kommunikation zu verbessern und Interaktionen zu optimieren.

Konversationale KI AI Analytics Assistant

Sembly AI

74.4K

Sembly AI ist ein innovativer intelligenter Assistent, der effizient Ihre Meetings aufzeichnet und zusammenfasst, um die Zusammenarbeit einfacher und produktiver zu gestalten.

KI-Teamassistent AI Meeting Assistant

GrowEasy

23.5K

In der heutigen wettbewerbsintensiven Marktsituation ist es entscheidend, Technologie zu nutzen, um Ihren Verkaufsansatz zu optimieren. Unsere KI-gestützte App zur Lead-Generierung revolutioniert die Art und Weise, wie Unternehmen potenzielle Kunden identifizieren und ansprechen. Durch den Einsatz fortschrittlicher Algorithmen und Datenanalysen vereinfacht dieses innovative Werkzeug den Prozess der Lead-Generierung und stellt sicher, dass Sie Ihre Zeit mit qualitativ hochwertigen Interessenten verbringen. Verbessern Sie Ihre Verkaufsstrategie und steigern Sie Ihre Conversion-Raten mit unserer modernen App, die für eine effiziente und effektive Lead-Generierung entwickelt wurde. Entdecken Sie noch heute die Zukunft des Verkaufs!

KI-gestützt AI Lead Generation

Find AI tools in YBX