С момента запуска мощной языковой модели GPT-4 от OpenAI в марте 2023 года пользователи и разработчики с нетерпением ожидают выхода её преемника, GPT-5. Однако OpenAI выбрала другой путь, представив новое семейство моделей: серию o1.
Введение в семью моделей o1
OpenAI представила свои последние AI модели, o1-preview и o1-mini, разработанные специально для решения сложных задач более эффективно, чем в серии GPT. Модель o1-preview доступна сегодня для пользователей ChatGPT Plus и ограничена 30 сообщениями в неделю, в то время как o1-mini позволяет отправлять 50 сообщений. Следует отметить, что, будучи ранними моделями, их функции еще находятся в разработке; в настоящее время они не поддерживают возможности, такие как интернет-серфинг и загрузка файлов, доступные в GPT-4.
Превосходные возможности моделей o1
OpenAI утверждает, что серия o1 превосходно справляется со сложными задачами в различных областях, включая науку, здравоохранение и технологии. Эти модели должны помочь физикам формулировать сложные уравнения и исследователям в области медицины эффективно аннотировать данные секвенирования клеток. Модель o1-mini предлагает особенно мощные возможности для разработчиков, подходящие для выполнения многоэтапных рабочих процессов, отладки кода и решения программных задач.
o1-preview: Уровень аспиранта
Модель o1-preview выделяет больше времени на обдумывание ответов, имитируя подход человека к решению проблем. Испытания показали, что она может работать на уровне аспирантов в области физики, химии и биологии. В программировании модель занимает 89-й процентиль в соревнованиях Codeforces, демонстрируя высокую proficiency в отладке и генерации решений. На квалификационном экзамене Международной олимпиады по математике она решила 83% задач, значительно улучшив показатель в 13%, полученный GPT-4. Эта модель сейчас доступна пользователям ChatGPT Plus и Team, а пользователи Enterprise и Edu получат доступ на следующей неделе. Кроме того, разработчики, имеющие доступ к API уровня 5, смогут использовать модели o1, хотя первоначальные лимиты по ставкам будут применяться.
o1-mini: Доступная и эффективная
Вместе с o1-preview OpenAI представила модель o1-mini, упрощённую версию, предлагающую более быстрые и экономичные аналитические возможности. Хотя она специализируется на кодировании и STEM-дисциплинах, o1-mini также показала впечатляющие результаты, набрав 70% по математическому критерию IMO, немного отстав от 74% o1-preview, но при значительно более низкой стоимости. В оценках программирования её Эло-рейти составило 1650 на Codeforces, что ставит её в топ 86% программистов. С ценой на 80% ниже чем у o1-preview, o1-mini подходит разработчикам и исследователям, которые ищут разумные возможности без глубоких знаний более сложной модели. Она будет доступна пользователям ChatGPT Plus, Team, Enterprise и Edu, с планами включить пользователей ChatGPT Free в будущем.
Улучшения безопасности и защиты
Приоритет безопасности OpenAI очевиден в обеих моделях, которые имеют усовершенствованные механизмы обучения безопасности. Модель o1-preview набрала впечатляющие 84 балла в одном из самых сложных тестов на взлом, что является значительным улучшением по сравнению со Score 22 у GPT-4. Способность этих моделей грамотно рассуждать о протоколах безопасности позволяет им лучше справляться с небезопасными запросами и снижать риск генерации неприемлемого контента. OpenAI также установила партнерство с Институтами безопасности ИИ в США и Великобритании, что поможет в оценке и тестировании будущих AI систем.
Будущие разработки серии o1
Хотя o1-preview и o1-mini являются мощными инструментами для решения задач, OpenAI понимает, что это только начало. Компания планирует регулярно улучшать эти модели, добавляя такие возможности, как интернет-серфинг, загрузка файлов и вызов функций в будущих обновлениях. По мере того как OpenAI продолжает развивать как серию GPT, так и серию o1, пользователи могут ожидать постоянного прогресса, который улучшит возможности и доступность ИИ в различных приложениях.