Heute ist ein bedeutender Tag in der KI-Entwicklung mit dem Launch von Llama 3, dem neuesten Large Language Model (LLM) von Meta Platforms, der Muttergesellschaft von Facebook, Instagram, WhatsApp und Oculus VR. Dieses Modell gilt als eines der leistungsstärksten Open-Source-KI-Systeme, das kurz nach einem frühen Leak auf Microsofts Azure Cloud-Dienst veröffentlicht wurde.
Das initiale Llama 3-Angebot umfasst zwei Versionen: ein Modell mit 8 Milliarden Parametern und ein Modell mit 70 Milliarden Parametern, die die Komplexität der Verbindungen zwischen künstlichen Neuronen beschreiben. Meta trainiert zudem aktiv an einer Version mit 400 Milliarden Parametern, für die jedoch noch kein Veröffentlichungsdatum bekannt gegeben wurde. Laut Ragavan Srinivasan, VP of Product bei Meta, zeigen diese Modelle außergewöhnliche Leistungen und weisen Benchmark-Fähigkeiten auf, die mit großen Mitbewerbern konkurrieren.
Aktuell übertreffen die Llama 3 Modelle mit 8B und 70B in verschiedenen Aufgaben die Konkurrenzmodelle von Google (Gemini Pro 1.5), Anthropic (Claude 3) und Mistral (7B Instruct). Insbesondere bei Multiple-Choice-Fragen und Programmieraufgaben zeigt Llama 3 herausragende Leistungen, hat jedoch in spezifischen Bereichen wie Textaufgaben in Mathe und Quizfragen auf Master-Niveau Schwächen. Die 8B-Version übertrifft jedoch konstant andere Modelle bei Grundschulmathematik.
Llama 3 sorgt nicht nur in Benchmarks für Furore, sondern ist auch die treibende Kraft hinter einem neuen eigenständigen Meta AI-Chatbot, der unter www.meta.ai verfügbar ist. Dieser Chatbot steht in direkter Konkurrenz zu OpenAIs ChatGPT, Anthropics Claude 3 und HuggingFaces HuggingChat. Mark Zuckerberg erklärt: „Meta AI ist der intelligenteste KI-Assistent, den Sie frei nutzen können.“
Der Meta AI-Chatbot bietet eine benutzerfreundliche Dialogschnittstelle und kann ohne Facebook-Login genutzt werden, obwohl die Funktionalität zunächst eingeschränkt sein könnte. Er beinhaltet ein integriertes Bildgenerierungsmodell, Meta Imagine, das eine nahezu Echtzeit-Erstellung von Bildern basierend auf Nutzeraufforderungen ermöglicht. Nutzer müssen sich mit ihren Facebook-Konten anmelden, um diese Funktion zu nutzen.
Im Gegensatz zu einigen anderen Plattformen erlaubt die Meta Imagine-Generation derzeit keine Anpassungen des Seitenverhältnisses für generierte Bilder, bietet jedoch ein einzigartiges Wasserzeichen zur Kennzeichnung von KI-generierten Inhalten. Nutzer können den Prozess der Bilderstellung live verfolgen und als Animation oder GIF wiedergeben.
Meta AI bezieht zudem aktuelle Informationen sowohl von Microsofts Bing als auch aus Googles Suchergebnissen, was die Fähigkeit zur Bereitstellung zeitnaher Antworten verbessert. Allerdings fehlt der aktuellen Version von Llama 3 die multi-modale Funktionalität, was bedeutet, dass Nutzer derzeit keine Bilder oder Dokumente zur Analyse hochladen können; Meta plant jedoch, dies in zukünftigen Updates zu berücksichtigen.
Ein wesentlicher Unterschied in Bezug auf den Open-Source-Status von Llama 3 ist, dass es unter einer spezifischen Lizenz von Meta operiert, ähnlich wie sein Vorgänger, Llama 2. Dritte Unternehmen können Llama für kommerzielle Zwecke nutzen, müssen jedoch für solche mit über 700 Millionen monatlich aktiven Nutzern eine Lizenz bei Meta beantragen. Dies hat Kritik aus der Open-Source-Community ausgelöst, da es den Wettbewerb einschränken könnte.
In Bezug auf Verbesserungen bietet Llama 3 reduzierte Falschablehnungsraten, eine bessere Ausrichtung und eine größere Vielfalt in den Antworten im Vergleich zu Llama 2. Diese Verbesserung resultiert aus einem umfassenden Trainingsprozess unter Verwendung einer dreigliedrigen Parallelisierungsstrategie, die die Trainingseffizienz um das Dreifache steigerte. Llama 3 wurde mit über 15 Billionen Tokens trainiert, was einer siebenfachen Steigerung im Vergleich zu Llama 2 entspricht.
Die 70B-Version bietet zudem ein Kontextfenster von 8.000 Tokens, fast doppelt so viel wie sein Vorgänger, was längere Eingabeaufforderungen und umfassendere Informationen ermöglicht. Llama 3 steht derzeit zum Download auf Metas AI-Website zur Verfügung und wird auf Plattformen wie AWS, Google Cloud und Microsoft Azure gehostet.
Für weitere Informationen zu Llama 3 besuchen Sie die offizielle AI-Website von Meta.