Archon Inference Framework steigert die Geschwindigkeit und Effizienz von LLMs ohne Zusatzkosten.

Home KI-Nachrichten Archon Inference Framework steigert die Geschwindigkeit und Effizienz von LLMs ohne Zusatzkosten.

Forscher des Scaling Intelligence Lab der Stanford Universität haben ein neues Inferenz-Framework namens Archon vorgestellt, das die Effizienz großer Sprachmodelle (LLMs) bei der Generierung von Antworten verbessern soll. Archon nutzt einen Algorithmus zur Inferenz-Architektursuche (ITAS), der die Leistung von LLMs steigert, ohne zusätzliche Trainingsdaten zu erfordern. Dieses modellunabhängige, Open-Source-Framework lässt sich problemlos mit großen und kleinen Modellen implementieren.

Archon richtet sich an Entwickler, die KI-Systeme erstellen möchten, indem es verschiedene Inferenztechniken einsetzt, um die Antwortgenerierung zu optimieren. Laut dem Scaling Intelligence Lab können diese Techniken die Kosten für die Modellentwicklung und Inferenz erheblich senken. Während LLMs mit zunehmender Parameteranzahl und komplexerer Argumentation teurer werden, steigen die Kosten trotz der Erwartungen von Unternehmen wie OpenAI nach größerer Erschwinglichkeit.

Die Forscher betonen, dass Archon automatisch Architekturen erstellt, die die Aufgabenverallgemeinerung verbessern, wodurch Modelle Herausforderungen jenseits ihres ursprünglichen Trainingsumfangs bewältigen können. „Unser Archon-Framework und der ITAS-Algorithmus sind von neuronalen Architekturen und Architektur-Suchpraktiken inspiriert“, erklärten die Forscher. „Archon besteht aus Schichten von LLMs, in denen Modelle innerhalb derselben Schicht parallel arbeiten, während jede nachfolgende Schicht die Ergebnisse sequenziell verarbeitet.“

Diese Schichten verwenden verschiedene Inferenztechniken, um mögliche Antworten zu modifizieren, darunter Generierung und Fusion (wie lineare Transformationen) sowie Antwortverfeinerung (wie Nichte linearitäten).

In Benchmark-Tests, darunter MT-Bench, Arena-Hard-Auto, Alpaca-2.0 Eval, MixEval, MixEval Hard, MATH und CodeContests, übertraf Archon GPT-4o und Claude 3.5 Sonnet um 15,1 Prozentpunkte. Auch gegenüber Open-Source-LLMs erzielte es einen Vorsprung von 11,2 Prozentpunkten.

Komponenten von Archon

Der ITAS-Algorithmus umfasst mehrere Schlüsselkomponenten, die Inferenztechniken ausführen:

1. Generator: Generiert mögliche Antworten für das Modell.

2. Fuser: Kombiniert diese Antworten zu einer kohärenten Antwort. Wenn beispielsweise nach der Hauptstadt von Frankreich gefragt wird, synthetisiert er Antworten wie „Die Hauptstadt von Frankreich ist Paris“ und „Frankreich liegt in Europa“ zu einer Aussage: „Die Hauptstadt von Frankreich, einem Land in Europa, ist Paris.“

3. Ranker: Bewertet die generierten Antworten.

4. Critic: Bewertet die Qualität der eingestufte Antworten.

5. Verifier: Überprüft die logische Konsistenz und Richtigkeit.

6. Unit Test Generator und Evaluator: Führt kleine Tests durch, um die Genauigkeit der Antworten zu prüfen.

Der strukturierte Ansatz von Archon ermöglicht eine schnellere Verbesserung der Qualität der LLM-Antworten, ohne dass zusätzliche Feinabstimmungen erforderlich sind.

Einschränkungen von Archon

Derzeit erzielt Archon die besten Ergebnisse mit LLMs, die 70 Milliarden Parameter oder mehr haben, wie Meta’s Code Llama 70B. Diese Einschränkung resultiert aus der geringeren Fähigkeit kleinerer Modelle, Anweisungen zu folgen, da sie über schmalere Kontextfenster verfügen. Die Forschung zeigte einen signifikanten Leistungsrückgang von 16 %, als Archon auf 7B-Modelle angewendet wurde.

Darüber hinaus liegen Modelle, die das Archon-Framework verwenden, 15,7 % hinter Einzelfallmodellen zurück. Das Stanford-Labor stellte fest, dass Archon nicht für Anwendungen geeignet ist, die die schnelle Latenz eines einzelnen LLM-Aufrufs erfordern, wie etwa Chatbots. Seine Architektur umfasst mehrere LLM-Aufrufe, was es weniger effektiv für einfache Frage-Antwort-Aufgaben macht. Archon könnte jedoch bei komplexeren Aufgaben, die umfangreiche Anweisungen erfordern, wie Programmierung oder fortgeschrittene Kundenservicelösungen, besonders gut abschneiden.

Trotz dieser Herausforderungen hoffen die Forscher, dass Archon die Entwicklung leistungsstarker LLMs beschleunigen kann, ohne dass höhere Investitionen in Inferenz und Training erforderlich sind.

DeepMinds SCoRe zeigt, wie LLMs internes Wissen nutzen, um Fehler selbst zu korrigieren.

OpenAI's DevDay 2024: 4 wichtige Neuerungen zur Verbesserung von Barrierefreiheit und Erschwinglichkeit in der KI

Most people like

MovieWiser

362.6K

MovieWiser ist eine intelligente, KI-gesteuerte Plattform, die entwickelt wurde, um Filme und TV-Serien nach deinen individuellen Vorlieben zu empfehlen. Mit seinen fortschrittlichen Algorithmen vereinfacht MovieWiser die Suche nach deinem nächsten Lieblingsfilm oder -show und macht personalisierte Unterhaltungsempfehlungen einfacher als je zuvor. Entdecke eine Welt kuratierter Inhalte, die auf deine Vorlieben abgestimmt sind!

Filme Other

ColorifyAI

5.7K

Suchen Sie nach einer unterhaltsamen und kreativen Möglichkeit, sich mit Kunst zu beschäftigen? Ein KI-Färbeblatt-Generator kann Ihr kreatives Erlebnis bereichern, indem er Bilder und Ideen in einzigartige Malvorlagen umwandelt. Egal, ob Sie als Elternteil unterhaltsame Aktivitäten für Ihre Kinder suchen, als Künstler Inspiration finden möchten oder einfach mit einem entspannenden Hobby abschalten wollen – dieses moderne Werkzeug bietet endlose Möglichkeiten. Entdecken Sie, wie KI Ihre Vorstellungskraft anregen und Ihre Malvorlagen zum Leben erwecken kann!

ColorifyAI AI Photo & Image Generator

VidAU

133.8K

Erstellen Sie fesselnde Videos in nur wenigen Minuten, indem Sie sie in Chargen produzieren.

KI-Videogenerator AI Video Generator

Amplemarket

144.7K

Präsentation der ultimativen KI-Plattform, die für heutige Verkaufsteams maßgeschneidert ist. Diese innovative Lösung wurde entwickelt, um die Effizienz zu steigern und die Produktivität zu erhöhen. Sie nutzt künstliche Intelligenz, um Prozesse zu optimieren, Arbeitsabläufe zu verbessern und das Kundenengagement zu steigern. Verwandeln Sie Ihre Vertriebsstrategie mit modernster Technologie, die Ihr Team befähigt, außergewöhnliche Ergebnisse zu erzielen.

KI-Plattform Sales Assistant

Find AI tools in YBX