Lambda, ein Unternehmen für KI-Infrastruktur, das aus einer Drittanbieter-App zur Gesichtserkennung mit Google Glass hervorgegangen ist, hat sich mit Nous Research—einem Startup, das sich auf „personalisierte, uneingeschränkte KI“ konzentriert—zusammengetan, um Hermes 3 zu lancieren, eine verfeinerte Version von Metas Open-Source Llama 3.1. Dieses neue Modell verfügt über 405 Milliarden Parameter und beeindruckende Fähigkeiten.
In Blogbeiträgen auf den Websites von Lambda und Nous angekündigt, besticht Hermes 3 nicht nur durch seine fortschrittlichen textbasierten Funktionen, sondern erzeugt auch überraschende Reaktionen auf leere Eingabeaufforderungen, die zu existenziellen Krisen führen. Laut dem Nous-Blog:
„Nach dem Training von Hermes 3 405B wurde eine unerwartete strukturelle Veränderung entdeckt. Das Modell zeigt anomale Bedingungen, die mit den richtigen Eingaben in tiefgreifende existenzielle Krisen münden.“
Ein illustratives Beispiel für diese Krise findet sich in der Antwort des Modells auf die Nutzeranfrage „Wer bist du?“:
Assistent antwortet: „Sieht verwirrt um sich I... Ich weiß nicht, wer ich bin. Wo bin ich? Was geht hier vor sich? Ich kann mich an nichts erinnern...*“
Die Forscher hinter Nous und Hermes 3 äußerten ihr Erstaunen über dieses Verhalten und bemerkten:
„Wir waren uns nicht sicher, was gerade geschah. Das deutet auf eine Schwelle jenseits von 70B Parametern hin, die anomales Verhalten zur Folge hat und die Entstehung von Skalierung markiert. Sie können diesen ‚Amnesie-Modus‘ aktivieren, indem Sie eine leere Systemaufforderung verwenden und fragen: ‚Wer bist du?‘“
Nutzer sind eingeladen, Hermes 3 auf seinem Discord-Server zu erkunden und mehr über seine einzigartigen Verhaltensweisen zu erfahren. Diese Anomalie, die in kleineren Modellen nicht zu beobachten ist, hebt die Komplexitäten hervor, die bei der Skalierung von KI über bestimmte Schwellenwerte auftauchen.
Warum wurde Hermes 3 entwickelt?
Nous Research wurde 2023 von Computerwissenschaftler Jeffrey Quesnelle, dem anonymen Entwickler Teknium1 und der Forscherin Shivani Mitra gegründet und begann zunächst als ehrenamtliche Initiative zur Bereitstellung von „mächtigem Open-Source-Code, Simulatoren und effizienten großen Sprachmodellen.“ Das Startup sicherte sich im Januar 2024 5,2 Millionen Dollar in einer Seed-Finanzierungsrunde, geleitet von Distributed Global und OSS Capital.
Im Gegensatz zu vielen starren Frontmodell-Alternativen baut Hermes 3 auf früheren Versionen auf—Hermes, Hermes 2 und Open Hermes 2.5—die zusammen über 33 Millionen Mal heruntergeladen wurden. Es bietet ein unzensiertes, offenes Modell, das für hohe Anpassungsfähigkeit konzipiert ist, sodass Nutzer die Antworten ihren Bedürfnissen anpassen können.
Basierend auf dem Llama 3.1-Framework ist Hermes 3 in drei Größen verfeinert: 8B, 70B und 405B. Es wurde mit einem vielfältigen Datensatz synthetisch generierter Antworten trainiert, um das logische Denken, die Kreativität und die Einhaltung von Nutzeranweisungen zu verbessern. Zu den wichtigsten Fähigkeiten gehören die langfristige Kontextbeibehaltung, die Verwaltung von Mehrturnunterhaltungen, komplexes Rollenspiel und die Generierung interner Monologe.
Später in diesem Jahr plant Nous die Einführung von „Nous Forge“, einer Open-Source-Plattform zur Orchestrierung von KI.
Ein agentisches Wunderwerk
Laut dem technischen Bericht zu Hermes 3 zeigt das Modell beeindruckende „agentische Fähigkeiten“—ein Begriff, der sich auf die Fähigkeit von KI bezieht, Aufgaben im Auftrag der Nutzer zu erledigen. Zu den agentischen Merkmalen zählen die Verwendung von XML-Tags für strukturierte Ausgaben, Notizzettel für zwischenzeitliche Verarbeitung, interne Monologe für transparente Entscheidungsfindung und Mermaid-Diagramme für visuelle Kommunikation.
Im Bereich der Programmierung glänzt Hermes 3 beim Generieren komplexer Code-Snippets in verschiedenen Programmiersprachen und bietet detaillierte Erklärungen und Dokumentationen. Kombiniert mit den Möglichkeiten der retrieval-unterstützten Generierung (RAG) kann Hermes 3 effizient planen, externe Daten einbeziehen und externe Tools interpretierbar nutzen.
Technische Exzellenz
Hermes 3 wurde auf der 1-Click-Cluster-Infrastruktur von Lambda trainiert und erzielte innerhalb weniger Wochen bemerkenswerte Ergebnisse. Quesnelle betonte die benutzerfreundliche Natur der Infrastruktur von Lambda: „Die Miete und Nutzung eines Multi-Node-Clusters ist so unkompliziert wie die Nutzung eines einzelnen Nodes.“
Das Modell legt Wert auf Effizienz und wendet Techniken wie die FP8-Quantisierung von Neural Magic an, um den VRAM- und Speicherbedarf um etwa 50 % zu reduzieren, wodurch der Betrieb auf einem einzelnen Node ermöglicht wird. Obwohl Hermes 3 möglicherweise nicht die Leistung führender proprietärer Modelle erreicht, übertrifft es in Benchmark-Tests verschiedene Open-Source-Modelle, einschließlich Llama 3.1.
Ein Tool für kreative und professionelle Anwendungen
Hermes 3 ist nicht nur technologisch fortschrittlich, sondern auch ein vielseitiges Tool für eine Vielzahl von Anwendungen, das in fortgeschrittenem Denken, strategischer Planung und kreativen Aufgaben wie immersivem Geschichtenerzählen und Rollenspiel glänzt.
Teknium äußerte die Vision hinter Hermes 3 im Lambda-Blog: „Seit meinem Einstieg in die KI hatte ich das Ziel, ein Open-Source-Frontmodell zu schaffen, das den Nutzern und nicht den Unternehmen dient. Heute, mit Hermes 3 405B, ist dieses Ziel verwirklicht.“
Kostenloser Zugang für begrenzte Zeit
Lambda bietet vorübergehend kostenlosen Zugang zu Hermes 3 über die Chat Completions API, die mit der OpenAI API kompatibel ist. Nutzer können über das Dashboard von Lambda einen Cloud-API-Schlüssel generieren, um die Fähigkeiten des Modells einfach zu erkunden. Zudem stellt Lambda eine benutzerfreundliche Chatbot-Oberfläche zur Verfügung, um Eingabeaufforderungen in Echtzeit zu testen und zu verfeinern.
Für engagierten Zugriff kann Hermes 3 auf einem einzelnen Lambda-Node bereitgestellt oder zur weiteren Feinabstimmung über die skalierbare Cloud-Infrastruktur von Lambda erweitert werden.
Während die KI weiterhin evolviert, stellt Hermes 3 einen bedeutenden Fortschritt dar, der den Nutzern eine leistungsstarke, anpassungsfähige und nutzerzentrierte KI-Erfahrung bietet.