OpenAI präsentiert das o1 Inferenzmodell: Übertrifft GPT-4 mit Fähigkeiten auf PhD-Niveau in Physik und Biologie.

Kürzlich hat OpenAI sein neuestes Modell "Strawberry", bekannt als "o1", vorgestellt. Diese neue Serie von KI-Modellen ist darauf ausgelegt, tiefer zu denken, bevor sie Fragen beantwortet. Im Vergleich zu früheren Modellen, die sich auf Wissenschaft, Programmierung und Mathematik konzentrierten, zeichnet sich das o1-Modell durch seine überlegene Fähigkeit zur komplexen Problemlösung und anspruchsvollerem logischen Denken aus. Durch verbesserte Schulung optimiert die o1-Serie nicht nur ihre Denkprozesse, sondern erkundet auch verschiedene Strategien und besitzt selbstkorrektive Fähigkeiten.

OpenAIs Bewertungen zeigen, dass das o1-Modell in Benchmark-Tests in Physik, Chemie und Biologie auf einem Doktoranden-Niveau abschneidet. Auch in Mathematik und Programmierung hebt sich o1 ab: Bei der Qualifikationsprüfung der Internationalen Mathematik-Olympiade (IMO) beantwortete das vorherige GPT-4o-Modell lediglich 13% der Fragen korrekt, während das o1-Modell beeindruckende 83% Genauigkeit erreichte. Zudem belegte o1 den 89. Perzentil bei Wettbewerben auf Codeforces, was sein außergewöhnliches Programmier Talent unter Beweis stellt.

Während o1 noch nicht über bestimmte praktische Funktionen von ChatGPT wie Web-Browsing und Dateiuploads verfügt, hebt OpenAI hervor, dass o1 besonders versiert ist, komplexe wissenschaftliche und mathematische Probleme zu lösen. Medizinische Forscher können o1 nutzen, um Zellsequenzierungsdaten zu analysieren, Physiker können komplexe mathematische Gleichungen für die Quantenoptik generieren, und Entwickler können o1 einsetzen, um mehrstufige Workflows zu erstellen.

OpenAI hat zudem o1-mini eingeführt, ein schnelleres und kostengünstigeres Denkmodell, das sich ideal für Programmieranwendungen eignet. o1-mini ist 80% günstiger als o1 und stellt eine budgetfreundliche Option für Szenarien dar, die ein Denken ohne umfassendes Weltwissen erfordern.

In Bezug auf Sicherheit hat OpenAI einen neuen Trainingsansatz eingeführt, der die Denkfähigkeiten des o1-Modells nutzt, um die Einhaltung von Sicherheits- und Alignierungsstandards zu verbessern. In Jailbreak-Tests erzielte o1-preview 84 Punkte im Vergleich zu 22 Punkten für GPT-4o, was erhebliche Verbesserungen im Bereich Sicherheit zeigt.

Aktuell sind die Vorschauversionen von o1 und o1-mini in ChatGPT (Plus und Team) sowie über die API verfügbar, mit Plänen, o1-mini in Zukunft allen kostenlosen ChatGPT-Nutzern zugänglich zu machen.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles