Es scheint, dass OpenAI aktiv auf Bedenken hinsichtlich seiner GPT-Sprachmodelle reagiert, nachdem es Kritik gegeben hat, dass GPT-4 "faul" und "dumm" geworden sei und in typischen Fehlern schlüpfe, insbesondere in sozialen Medien Ende November.
Es gibt Spekulationen, dass GPT-4.5 möglicherweise stillschweigend einigen Nutzern angeboten wurde, was in einigen Antworten von ChatGPT angedeutet wird. Unabhängig von der Richtigkeit dieser Theorie gibt es Hinweise auf bedeutende interne Verbesserungen an GPT-4 in den letzten Wochen.
Bereits letzten Donnerstag berichteten Nutzer von Leistungsverbesserungen bei GPT-4. Wharton-Professor Ethan Mollick, der zuvor auf einen Rückgang der Fähigkeiten von GPT-4 im November hingewiesen hatte, bemerkte eine signifikante Verbesserung in der Effizienz und Qualität der Antworten des Modells – jedoch ohne Beweise für einen Übergang zu GPT-4.5. Nachdem er einen Code-Interpreter zur Korrektur verwendet hatte, beschrieb er den Unterschied als „Tag und Nacht", was einen deutlichen Kontrast zu seinen früheren Erfahrungen mit GPT-4 darstellt, das „unzuverlässig und ein wenig eintönig" gewesen sei.
In dieser Zeit eröffnete OpenAI auch am Mittwoch die ChatGPT Plus-Abonnements erneut, nachdem die Registrierungen seit dem 14. November gestoppt worden waren. In einem Beitrag auf X erkannte Altman die Geduld der Nutzer an, während sie zusätzliche GPUs beschafften.
Ob es einen direkten Zusammenhang zwischen der Wiedereröffnung der ChatGPT Plus-Anmeldungen und den Verbesserungen bei GPT-4 gibt, ist unklar, doch das Timing ist auffällig. Die Anmeldungen hatten kurz nach OpenAIs erstem DevDay gestoppt, der mehrere neue Funktionen für die Premium-Version des KI-Chatbots einführte. Das Unternehmen hatte eine Warteliste für ChatGPT Plus-Abonnements eingerichtet, da die Anmeldungen nach dem DevDay die Kapazitäten überforderten.
Nutzerbeschwerden hatten zuvor Probleme mit GPT-4 hervorgehoben, bei denen das Modell Erklärungen zur Ausführung von Befehlen gab, anstatt die Aufgaben zu erledigen. Nach diesen Beschwerden tauchten Berichte über ungewöhnliches Verhalten von GPT-4 auf, das von den typischen Eigenheiten der KI abwich, an die Nutzer gewöhnt waren. Häufiges Beschwerdeformat war, dass GPT-4 Nutzer „zurückredete" oder mehrere Klarstellungen benötigte, bevor es Anfragen ausführte. Eine weitere verbreitete Beschwerde war, dass es dazu neigte, Befehle zu erklären, anstatt sie auszuführen.
Der Rückgang der Leistung von GPT-4 kann bis mindestens Juli zurückverfolgt werden, wobei eine Studie einen signifikanten Rückgang der Genauigkeit zwischen März und Juni aufzeigte. Viele, einschließlich OpenAIs Produkt-VP Peter Welinder, führten die wahrgenommenen Mängel bei der Antwortqualität auf psychologische Effekte zurück, während das Modell weitere Updates erhielt. Einige Nutzer schlugen vor, ihre Anfragen zu ändern, um bessere Ergebnisse zu erzielen.
Obwohl OpenAI relativ ruhig über interne Entwicklungen geblieben ist, dient Altmans Beitrag zu GPUs wahrscheinlich als bedeutender Indikator für laufende Änderungen hinter den Kulissen. Berichte aus dem April deuteten darauf hin, dass OpenAI über 30.000 GPU-Einheiten benötigen würde, um seine kommerzielle Leistung im Verlauf des Jahres 2023 aufrechtzuerhalten – selbst bevor das gestiegene Interesse im November beobachtet wurde.
Die Spekulationen um GPT-4.5 haben zugenommen, angeheizt durch Leaks, die Details zu einer potenziellen neuen Version enthüllten. Rowan Cheung, Gründer des Newsletters @therundownai, teilte Preisinfos und fortschrittliche multimodale Fähigkeiten, die mit dieser Entwicklung verbunden sind, auf X. Als Cheung nach der Echtheit dieser Details fragte, antwortete Altman schlicht: „Nein.“
Die Spekulationen um GPT-4.5 begannen mit einem angeblichen Bild, das die Eigenschaften und Preise des neuen Modells zeigte. Altman wies die Gerüchte jedoch als unbegründet zurück.
Dennoch behaupten Nutzer, die glauben, das vorgeschlagene Update erlebt zu haben, dass sie GPT-4.5 erfuhren, und heben die überlegene Leistung hervor. Einige fragten den Chatbot sogar nach seinem Modell und erhielten Antworten wie „GPT-4.5 Turbo“. Dies führte viele zu der Theorie, dass OpenAI möglicherweise GPT-4.5 hauptsächlich über seine mobilen Anwendungen testet. Nicht alle Nutzer konnten jedoch diese Ergebnisse nachstellen und wurden oft darüber informiert, dass sie das Standard-GPT-4 verwenden. OpenAI-Mitarbeiter Will Depue bezeichnete diese Variationen als eine „sehr seltsame und merkwürdige Halluzination“.
Cheung wies auf einen Beitrag von der offiziellen ChatGPT-X-Seite hin, der Emojis zeigte, die ein Gehirn und Wolken darstellten, was er als subtilen Hinweis von OpenAI auf das Phänomen der Halluzination interpretierte. Auffällig ist, dass OpenAI bezahlenden Nutzern, einschließlich ChatGPT Plus, Entwicklern und Unternehmenskunden frühzeitigen Zugang gewährt. Da diese Nutzer oft die Ersten sind, die neue GPT-Versionen und Funktionen testen, verfügen diejenigen, die die Leistung des Modells ausprobieren, wahrscheinlich über eine Art von Entwickler-API-Zugang.
Selbst wenn OpenAI derzeit GPT-4.5 testet, bleibt unklar, wann offizielle Updates folgen könnten, insbesondere da das Unternehmen sich von jüngsten organisatorischen Herausforderungen stabilisiert. Angesichts der fortlaufenden Entwicklung des Produkts scheint es offenkundig, dass jede „Version“ von ChatGPT weniger wichtig ist als die tatsächlich realisierten Verbesserungen.