Heute hat Inflection AI, das in Palo Alto ansässige Startup, das von DeepMinds Mustafa Suleyman und LinkedIn-Gründer Reid Hoffman mitbegründet wurde, sein neuestes Fundamentalmuster, Inflection-2.5, vorgestellt.
Aufbauend auf seinem Vorgänger verbessert Inflection-2.5 die Leistung erheblich und kommt OpenAIs GPT-4, insbesondere in STEM-Fächern, sehr nahe. Dieses neue Modell treibt den Pi-Assistenten des Unternehmens an, der mit ChatGPT und Gemini konkurriert und auf mobilen und Web-Plattformen zugänglich ist.
Fortschritt im KI-Wettbewerb
Diese Einführung stellt einen strategischen Schritt im rasanten KI-Markt dar, in dem Unternehmen ständig versuchen, die Dominanz von OpenAI herauszufordern. Kürzlich präsentierte Anthropic Claude 3 Opus und übertraf die Leistung von GPT-4.
Inflection-2.5: Leistungsübersicht
Seit seiner Einführung strebt Inflection AI an, eine „einfühlsame, nützliche und sichere“ KI zu schaffen, die ein persönlicheres Gesprächserlebnis bietet als andere Modelle, einschließlich der GPT-Serie. Die neue empathische Feinabstimmung verleiht Pi eine markante Persönlichkeit und einen hohen emotionalen Quotienten (EQ).
Mit Inflection-2.5 möchte das Startup den IQ des Modells, insbesondere in Bereichen wie Physik und Mathematik, weiter steigern. Nutzer können nun mit Pi über eine breite Palette von Themen interagieren, von Hobbys über Programmierung bis hin zu Biologieaufgaben und Businessplanung.
Benchmark-Leistung
In Benchmark-Auswertungen zeigt Inflection-2.5 erhebliche Verbesserungen gegenüber Inflection-1 und verringert den Abstand zu GPT-4, bleibt jedoch hinter diesem zurück. So erzielte Inflection-2.5 beispielsweise auf dem MMLU-Benchmark, der eine Vielzahl von Aufgaben bewertet, 85,5 Punkte, dicht hinter GPT-4 mit 87,3. In den STEM-Prüfungen erreichte es 63 Punkte im ungarischen Mathematiktest im Vergleich zu GPT-4s 68 und erzielte das 85. Perzentil im Physics GRE, während GPT-4 das 97. Perzentil erreichte.
Im GSM8K-Benchmark, der 8.500 hochwertige Matheaufgaben für Grundschüler enthält, erreichte Inflection-2.5 86,3 Punkte, während GPT-4 auf 92 Punkte kam. Im Zero-Shot HumanEval-Test, der die Programmierfähigkeiten bewertet, erhielt es 73,8 Punkte im Vergleich zu GPT-4s 79,3.
Effiziente Schulung und Echtzeitfähigkeiten
Obwohl es GPT-4 nicht übertrifft, betont Inflection AI, dass Inflection-2.5 „94% der Leistung von GPT-4“ mit einem effizienteren Trainingsprozess erreicht, bei dem nur 40% der für GPT-4 verwendeten Rechenleistung benötigt werden.
Wie GPT-4 integriert auch Inflection-2.5 Echtzeit-Websuchfunktionen, die den Nutzern aktuelle Informationen zu Ereignissen bereitstellen, was einen bedeutenden Fortschritt für den Pi-Assistenten darstellt, der für alle zugänglich sein soll. Es ist jedoch zu beachten, dass die Qualität der online abgerufenen Ergebnisse variieren kann, da dafür keine Benchmarks existieren.
Zugriff auf Inflection-2.5
Inflection AI hat das neue Modell bereits in seinen Pi-Chatbot integriert, sodass Nutzer dessen Fähigkeiten sofort testen können. Obwohl das Unternehmen keine konkreten Vorteile für die Nutzer durch das Upgrade genannt hat, hebt es die positive Auswirkung auf das Nutzerengagement, die Bindung und das organische Wachstum des Chatbots hervor.
Derzeit verzeichnet der Pi-Chatbot, verfügbar auf Android, iOS, web und Desktop, eine Million tägliche und sechs Millionen monatliche aktive Nutzer, mit über vier Milliarden ausgetauschten Nachrichten und einer durchschnittlichen Gesprächsdauer von 33 Minuten.