OpenAI sorgte gestern für Aufregung in der Tech-Community, indem es eine neue Familie von reasoning-fokussierten großen Sprachmodellen (LLMs) mit dem Namen "o1" vorstellte, anstelle des erwarteten "Strawberry" oder GPT-5. Die o1-Modelle sind darauf ausgelegt, in den Bereichen Wissenschaft, Technologie, Ingenieurwesen und Mathematik (MINT) herausragende Leistungen und Genauigkeit zu bieten.
Zwei neue Modelle stehen jetzt zur Verfügung: o1-preview und das weniger komplexe o1-mini. Diese Modelle sind für ChatGPT-Plus-Nutzer sowie für Entwickler zugänglich, die OpenAIs kostenpflichtige API nutzen, um sie in bestehende Anwendungen zu integrieren oder neue zu entwickeln.
Verbesserte Denkfähigkeiten
Laut Michelle Pokrass, der technischen Leiterin der OpenAI-API, nutzen die o1-Modelle fortschrittliche Denktechniken. Sie passen Strategien an, lernen aus Fehlern und durchlaufen umfassende kognitive Prozesse. In Tests zeigen diese Modelle eine Leistung, die mit der von Doktoranden bei anspruchsvollen Benchmarks vergleichbar ist.
Nikunj Handa von OpenAI betonte, dass die o1-Modelle in reasoning-relevanten Aufgaben die GPT-Serie wesentlich übertreffen.
Wichtige Details für Entwickler
- Textbasierte Ausgaben: Derzeit sind beide Modelle auf Text-Eingaben und -Ausgaben beschränkt, was sie weniger geeignet für multimodale Aufgaben wie Bild- oder Dateianalyse macht. Für diese Anforderungen bleibt GPT-4o die empfohlene Wahl.
- Wissenstand: Die o1-Modelle können nicht im Internet surfen und basieren ausschließlich auf ihrem Trainingsdatenstand bis Oktober 2023, obwohl Nutzer zusätzlichen Kontext über Texteingaben bereitstellen können.
- Antwortzeiten: Die Generierung von Ausgaben erfolgt langsamer, wobei einige Antworten über eine Minute in Anspruch nehmen können. Frühere Tester berichteten jedoch von einer erhöhten Leistung in Aufgaben wie Programmierung und der Erstellung juristischer Dokumente.
OpenAI empfiehlt, dass für Aufgaben, die schnellere Antworten erfordern, GPT-4o ideal ist, während die o1-Modelle für Anwendungen bevorzugt werden könnten, die tiefgreifendes Denken benötigen.
Preismodell
Der Zugang zu den o1-Modellen erfordert eine beträchtliche Investition in OpenAIs APIs, die nur für "Tier 5"-Nutzer verfügbar sind, die mindestens 1.000 USD ausgegeben und vor mehr als 30 Tagen gezahlt haben. Das o1-preview-Modell ist mit 15 USD pro Million Eingabetokens und 60 USD pro Million Ausgabetokens bemerkenswert teuer, während o1-mini mit 3 USD pro Million Eingabetokens und 12 USD pro Million Ausgabetokens günstiger ist.
Aktuell sind die o1-Modelle auf 20 Anfragen pro Minute begrenzt, und die Gruppierung von Anfragen wird nicht unterstützt.
Anwendungsbereiche für o1-Modelle
Mit der Einführung von o1-preview und o1-mini beginnen Entwickler, deren Einsatzmöglichkeiten zu erkunden. Einige frühe Erkenntnisse umfassen:
- Dokumentenerstellung: Die Modelle können gut entwickelte Aktionspläne und Whitepapers basierend auf einfachen Eingaben erstellen.
- Betriebsoptimierung: Nutzer haben die Automatisierung von Mitarbeitereinsatzplänen, die Bewertung von Fusionsrisiken, den Entwurf effizienter Lagerhäuser und die Balancierung von Stromnetzen demonstriert.
- App- und Spielentwicklung: Das o1-preview-Modell ermöglicht die schnelle Erstellung interaktiver Anwendungen und Spiele.
- Automatisierung von RFPs: Die o1-Modelle können Auftragnehmern helfen, Ausschreibungsunterlagen durch die Verarbeitung von Textanfragen zu vervollständigen.
- Strategische Planung: Entwickler haben die Wirksamkeit von o1-preview bei der Entwicklung detaillierter Wachstumsstrategien festgestellt, einschließlich der Nutzung von Plattformen wie Reddit für Engagement.
Zugang zu OpenAIs o1-Modellen
Entwickler können auf die o1-Modelle über die öffentliche API von OpenAI, Microsoft Azure OpenAI Service, Azure AI Studio und GitHub Models zugreifen. Obwohl sie nicht für jeden Entwickler geeignet sind, bietet die Einführung der o1-Familie einzigartige Möglichkeiten für diejenigen, die in der KI-Anwendungsentwicklung innovativ sein möchten. OpenAI setzt sich dafür ein, sowohl die o1-Familie als auch die bestehende GPT-Serie weiterzuentwickeln und vielfältige Optionen für Entwickler anzubieten.