Недавно OpenAI представила свою новую модель "Strawberry", известную как "o1". Эта серия моделей искусственного интеллекта разработана для более глубокого анализа и размышлений перед ответом на вопросы.
В отличие от предыдущих моделей, сосредоточенных на науке, программировании и математике, модель o1 превосходит в задачах сложного рассуждения и решении более трудных проблем. Благодаря усовершенствованному обучению, серия o1 не только улучшает свои мыслительные процессы, но и исследует различные стратегии, обладая способностями к самокоррекции.
Оценки OpenAI показывают, что модель o1 демонстрирует уровень знаний, соответствующий докторской степени, в бенчмарк-тестах по физике, химии и биологии. В математике и программировании o1 также выделяется: на квалификационном экзамене Международной математической олимпиады (IMO) предшествующая модель GPT-4o дала правильные ответы только на 13% вопросов, в то время как модель o1 достигла впечатляющего результата в 83%. Кроме того, o1 заняла 89-й процентиль в соревнованиях на Codeforces, что подчеркивает ее выдающиеся способности в программировании.
Хотя модель o1 пока не обладает некоторыми практическими функциями ChatGPT, такими как веб-серфинг и загрузка файлов, OpenAI подчеркивает, что o1 особенно хороша в решении сложных научных и математических задач. Медицинские исследователи могут использовать o1 для анализа данных секвенирования клеток, физики могут генерировать сложные математические уравнения для квантовой оптики, а разработчики — создавать многошаговые рабочие процессы.
OpenAI также запустила o1-mini — более быструю и экономически эффективную модель рассуждений, идеально подходящую для программирования. Цена o1-mini на 80% ниже, чем у o1, что делает ее доступным вариантом для сценариев, требующих рассуждений без обширных знаний о мире.
В сфере безопасности OpenAI внедрила новый подход к обучению, который использует способности рассуждения модели o1 для повышения соответствия стандартам безопасности и согласования. В тестах на взлом o1-preview набрала 84 балла, в то время как GPT-4o — только 22, что демонстрирует значительное улучшение в обеспечении безопасности.
В настоящее время предварительные версии o1 и o1-mini доступны в ChatGPT (Plus и Team) и через API, планируется также сделать o1-mini доступной для всех бесплатных пользователей ChatGPT в будущем.