Seit der Einführung des leistungsstarken GPT-4-Modells von OpenAI im März 2023 haben Nutzer und Entwickler gespannt auf die Veröffentlichung seines Nachfolgers, GPT-5, gewartet. Doch OpenAI verfolgt einen anderen Weg und präsentiert eine neue Modellfamilie: die o1-Serie.
Einführung der o1-Modellfamilie
OpenAI hat seine neuesten KI-Modelle, o1-preview und o1-mini, vorgestellt, die speziell entwickelt wurden, um komplexe Aufgaben effektiver zu bewältigen und herausfordernde Probleme zu lösen als die GPT-Serie. Der o1-preview steht ab sofort Nutzern von ChatGPT Plus zur Verfügung und ist auf 30 Nachrichten pro Woche begrenzt, während der o1-mini die Nutzung von 50 Nachrichten ermöglicht. Da es sich um frühe Modelle handelt, sind ihre Funktionen noch in der Entwicklung; derzeit fehlen Merkmale wie das Surfen im Internet und der Datei-Upload, die in GPT-4 verfügbar sind.
Überlegene Fähigkeiten der o1-Modelle
OpenAI betont, dass die o1-Serie in der Lage ist, komplexe Probleme in verschiedenen Bereichen wie Wissenschaft, Gesundheitswesen und Technologie zu bearbeiten. Diese Modelle sollen Physikern helfen, komplizierte Gleichungen zu formulieren, und Gesundheitsforschern unterstützen, Zellsequenzierungsdaten effektiv zu annotieren.
Das o1-mini-Modell bietet besonders robuste Funktionen für Entwickler, was es ideal für die Durchführung von Mehrschritt-Workflows, das Debuggen von Code und die Bewältigung von Programmierherausforderungen macht.
o1-preview: Leistung auf Doktoratsniveau
Das o1-preview-Modell gewährt mehr Zeit für durchdachte Antworten und ahmt den problemlösenden Ansatz von Menschen nach. Tests haben gezeigt, dass es auf einem Niveau vergleichbar mit Doktoranden in Physik, Chemie und Biologie arbeiten kann. In Programmierwettbewerben erzielt es den 89. Percentil-Rang bei Codeforces, was eine hohe Kompetenz beim Debuggen und Generieren von Lösungen beweist. Im Qualifikationstest der Internationalen Mathematik-Olympiade löste es 83 % der Aufgaben – eine signifikante Verbesserung gegenüber der Erfolgsquote von 13 % bei GPT-4.
Dieses Modell ist derzeit für ChatGPT Plus- und Team-Nutzer zugänglich, während Enterprise- und Edu-Nutzer nächste Woche Zugang erhalten. Außerdem können Entwickler, die für die API-Stufe 5 berechtigt sind, auf die o1-Modelle zugreifen, wobei zu Beginn Einschränkungen gelten.
o1-mini: Preiswert und effizient
Neben dem o1-preview wurde das o1-mini-Modell eingeführt, eine optimierte Version, die schnellere und kostengünstigere Denkfähigkeiten bietet. Während es auf Programmierung und MINT-Bereiche spezialisiert ist, erzielte o1-mini ebenso beeindruckende Ergebnisse mit 70 % beim IMO-Mathematikbenchmark, dicht hinter den 74 % des o1-preview – jedoch zu deutlich geringeren Kosten. In Programmierbewertungen erreichte es einen Elo-Score von 1650 auf Codeforces und gehört damit zu den besten 86 % der Programmierer.
Mit einem um 80 % reduzierten Preis im Vergleich zum o1-preview richtet sich der o1-mini an Entwickler und Forscher, die Denkleistungen ohne das umfangreiche Wissen des komplexeren Modells suchen. Er wird für Nutzer von ChatGPT Plus, Team, Enterprise und Edu verfügbar sein, mit Plänen, in Zukunft auch ChatGPT Free-Nutzer einzubeziehen.
Sicherheits- und Schutzverbesserungen
OpenAIs Engagement für Sicherheit zeigt sich in beiden Modellen, die verbesserte Sicherheitsmechanismen aufweisen. Das o1-preview-Modell erzielte beeindruckende 84 Punkte in einem der herausforderndsten Jailbreaking-Tests, was eine erhebliche Verbesserung gegenüber dem Punktestand von 22 bei GPT-4 darstellt. Die Fähigkeit dieser Modelle, über Sicherheitsprotokolle im Kontext nachzudenken, rüstet sie besser aus, um unsichere Eingaben zu verarbeiten und das Risiko der Generierung unangemessener Inhalte zu mindern.
OpenAI hat außerdem Partnerschaften mit den AI Safety Institutes in den USA und Großbritannien etabliert, um die Evaluierung und den Test zukünftiger KI-Systeme zu fördern.
Zukünftige Entwicklungen für die o1-Serie
Obwohl der o1-preview und der o1-mini leistungsstarke Problemlösungstools sind, sieht OpenAI dies erst als den Anfang. Das Unternehmen plant regelmäßige Verbesserungen dieser Modelle, einschließlich Funktionen wie Surfen, Datei-Uploads und Funktionsaufrufe in kommenden Updates.
Während OpenAI sowohl die GPT- als auch die o1-Serie weiterentwickelt, können die Nutzer fortlaufende Fortschritte erwarten, die die Fähigkeiten und Zugänglichkeit von KI in verschiedenen Anwendungen erweitern.