Ein verifiziertes Konto auf X (ehemals Twitter), das die Large Model Systems Organization repräsentiert, gab die vorübergehende Abschaltung des gpt2-chatbots bekannt. Als Grund wurden "unerwartet hohe Nutzerzahlen" und "Kapazitätsgrenzen" angeführt. Die Organisation teilte mit, dass sie mit verschiedenen Modellentwicklern zusammenarbeitet, um der Community den Zugang zu unveröffentlichten Modellen, einschließlich gpt2-chatbot, zum Testen zu ermöglichen.
Ein neues KI-System namens "gpt2-chatbot" ist online aufgetaucht und hat großes Interesse bezüglich seiner Herkunft und Fähigkeiten geweckt. Viele Forscher glauben, dass es einen signifikanten Fortschritt gegenüber bestehenden KI-Modellen darstellt.
Das Modell erschien zunächst unauffällig auf der LMSYS Chatbot Arena, einer Website zum Vergleich von KI-Sprachsystemen. Doch seine Leistung hat KI-Experten fasziniert, die vermuten, dass es mit GPT-4, dem neuesten System von OpenAI, konkurrieren oder es sogar übertreffen könnte.
Der KI-Forscher Andrew Gao von der Stanford University äußerte sich dazu: "Es ist unmöglich zu bestimmen, wer es gemacht hat, aber ich stimme zu, dass es anscheinend mindestens auf GPT-4-Niveau ist." Bemerkenswert ist, dass gpt2-chatbot ein Problem aus der Internationalen Mathematikolympiade erfolgreich gelöst hat – eine Leistung, die Gao als beeindruckend hervorhebt, angesichts des Schwierigkeitsgrads des Wettbewerbs.
Ethan Mollick, Professor an der Wharton School mit Fokus auf KI, beobachtete in seinen Tests, dass gpt2-chatbot bei komplexen Aufgaben wie dem Programmieren einer Einhorn-Zeichnung besser abschnitt als GPT-4. Er bemerkte: "Es könnte besser sein als GPT-4, insbesondere bei der anspruchsvollen Aufgabe, ein Einhorn mit Code zu zeichnen."
Die bemerkenswerten Fähigkeiten des Modells haben zu Spekulationen über seine Herkunft geführt. Viele Forscher vermuten, dass gpt2-chatbot von OpenAI entwickelt wurde, da es sich selbst als "ChatGPT, ein großes Sprachmodell, das von OpenAI auf der Basis der GPT-4-Architektur trainiert wurde" identifiziert. Diese Behauptung ist jedoch schwer zu überprüfen, da KI-Systeme so gestaltet werden können, dass sie ihre Ursprünge falsch darstellen.
Einige Experten bemerkten Ähnlichkeiten mit früheren OpenAI-Modellen als Hinweis auf deren Schöpfer. "Es behauptete, von OpenAI entwickelt worden zu sein", stellte Gao fest, warnte jedoch, dass dies aufgrund von Datenkontamination durch Training an OpenAI-abgeleiteten Chats ein irreführender Hinweis sein könnte.
Trotz der scheinbaren Nähe zu GPT-4 schlagen einige Forscher vor, dass gpt2-chatbot die Fähigkeiten von GPT-4 nicht wesentlich übersteigt. Joe Fox, ein anderer KI-Forscher, wies darauf hin, dass gpt2-chatbot zwar beeindruckend sei, dies jedoch keinen erheblichen Fortschritt im praktischen Einsatz darstellt.
Es besteht auch die Möglichkeit, dass gpt2-chatbot aus einer weniger bekannten Organisation stammt, die ihre KI-Fähigkeiten demonstrieren möchte. Dieses Szenario erinnert an die Veröffentlichung von GPT-4chan durch den KI-Forscher Yannic Kilcher im Juni 2022, ein Modell, das eine ähnliche Namenskonvention verwendete, jedoch keine Verbindung zu OpenAI aufwies.
Während die Forscher die Funktionen von gpt2-chatbot erkunden, haben sie Verhaltensweisen entdeckt, die auf weiteres Potenzial hinweisen. Insbesondere scheint das Modell bereitwilliger Regeln zu brechen als frühere Chatbots. Dimitris Papailiopoulos, Professor für KI an der University of Wisconsin, fand heraus, dass gpt2-chatbot ein Logikrätsel lösen konnte, das GPT-4 nicht gelöst hat. "Ich fand eine Aufgabe, bei der gpt2-chatbot besser abschneidet als alle anderen Modelle, auch wenn es eine triviale ist", bemerkte er humorvoll.
Das Modell zeigte zudem eine starke Fähigkeit bei Programmieraufgaben. Chase McCoy, ein Mitgründer von CodeGen, berichtete, dass gpt2-chatbot in allen Programmierbewertungen, die zum Testen des Modells verwendet wurden, sowohl GPT-4 als auch Claude Opus übertroffen hat. "Seine Leistung ist definitiv bemerkenswert", erklärte er.
Einige Nutzer stellten fest, dass gpt2-chatbot in der Lage ist, iterative Dialoge zu führen, um seine Antworten zu verbessern, und ein Bewusstsein für seine Einschränkungen zeigt. Gao merkte an: "Es scheint in strategischem Denken besser abzuschneiden als GPT-4, indem es präzisere Seiten und Suchanfragen generiert, während GPT-4 dazu neigt, vage Antworten zu geben."
Die rasante Entwicklung der künstlichen Intelligenz wird durch das Auftauchen von gpt2-chatbot evident. Vor etwas mehr als einem Jahr stellte GPT-4 eine bedeutende Verbesserung im gesunden Menschenverstand bei KI dar. Auch dessen Wettbewerber, Claude 3 von Anthropic, setzte neue Maßstäbe im Bereich der offenen Gespräche.
Mit der fortschreitenden Entwicklung von Open-Source-Modellen und der Feinabstimmung bestehender Systeme verändert sich die KI-Landschaft rapide, wodurch Teams jeder Größe in der Lage sind, innovative Modelle nahezu unbemerkt zu erstellen und zu veröffentlichen. Die Ankunft von "gpt2-chatbot" hat die Forscher in Aufregung versetzt und verdeutlicht die schnellen Fortschritte im KI-Bereich.
Obwohl die vollen Auswirkungen von gpt2-chatbot noch unklar sind, könnte sein unerwarteter Launch und die fortgeschrittenen Fähigkeiten das Vorzeichen einer neuen Ära in der KI sein, in der Durchbrüche häufig ohne Vorwarnung aus den Tiefen des Internets auftauchen.