Вот почему пользователи восторгаются резкими улучшениями в GPT-4

Похоже, что OpenAI активно реагирует на опасения касательно своих языковых моделей GPT, после критики, что GPT-4 становится «ленивым», «недалеким» и испытывает atypical ошибки, о чем особенно много говорилось в социальных сетях в конце ноября.

Появились слухи о том, что GPT-4.5, возможно, было тихо введено для определённых пользователей, о чем намекают некоторые ответы ChatGPT. Независимо от достоверности этой теории, за последние недели наблюдаются значительные внутренние улучшения в GPT-4.

Уже в прошлый четверг пользователи начали сообщать о улучшениях в производительности GPT-4. Профессор Уортонской школы Итан Моллик, который ранее отмечал снижение возможностей GPT-4 в ноябре, заявил о значительном повышении эффективности и качества ответов модели, хотя и без каких-либо доказательств перехода на GPT-4.5. После исправлений через интерпретатор кода он описал разницу как «день и ночь», резко контрастируя с его прежними впечатлениями, когда GPT-4 был «ненадежным и несколько тупым» на протяжении нескольких недель.

В это же время OpenAI снова открыла подписки на ChatGPT Plus в прошлую среду, после приостановки регистрации с 14 ноября. В посте на X Алтман признал терпение пользователей, пока они получали дополнительные GPU.

Хотя нет уверенности в том, существует ли прямая связь между открытием подписок ChatGPT Plus и улучшениями в GPT-4, само время событий вызывает интерес. Подписки были приостановлены вскоре после первого DevDay OpenAI, на котором были представлены несколько новых функций для премиум-версии AI-чатбота. Компания ввела лист ожидания для подписок ChatGPT Plus, поскольку регистрация после DevDay переполнила её мощности.

Пользовательские жалобы ранее поднимали вопросы о проблемах с GPT-4, когда модель больше объясняла выполнение команд, чем выполняла задачи. После этих жалоб начали поступать сообщения об аномальном поведении GPT-4, отличающемся от типичных особенностей AI, к которым привыкли пользователи. Часто возникала проблема «возвращения» диалога с пользователями или необходимости давать многократные уточнения перед выполнением запросов. Другой распространённой жалобой было стремление объяснять, а не завершать команды.

Снижение производительности GPT-4 прослеживается как минимум с июля, и в одном из исследований было указано на значительное падение точности между мартом и июнем. Многие, включая вице-президента по продуктам OpenAI Питера Уэлиндера, предположили, что воспринимаемые недостатки в качестве ответов могли быть результатом психологических эффектов, когда модель испытывала дальнейшие обновления. Некоторые пользователи предложили, что изменение формулировок запросов может помочь получить лучшие результаты.

Хотя OpenAI остается относительно тихой по поводу своих внутренних разработок, пост Алтмана о GPU, вероятно, служит значительным показателем продолжающихся изменений за кулисами. Согласно отчетам с апреля, OpenAI понадобилось бы более 30 000 блоков GPU для поддержания своей коммерческой деятельности до конца 2023 года, даже до роста интереса, наблюдавшегося в ноябре.

Слухи о GPT-4.5 возросли, подогреваемые утечками информации о потенциальной новой версии. Рован Чеунг, основатель рассылки @therundownai, поделился информацией о ценах и расширенных мультимодальных возможностях, связанных с этим развитием, на X. Когда Чеунг спросил о достоверности этих данных, Алтман просто ответил: «Нет».

Спекуляции о GPT-4.5 начались с предполагаемого изображения, показывающего функции и цены новой модели. Однако Алтман отверг эти слухи как необоснованные.

Тем не менее, пользователи, которые считают, что столкнулись с предложенным обновлением, утверждают, что испытывают GPT-4.5, отмечая улучшенную производительность. Некоторые даже спрашивали у чатбота о его модели, получая ответы вроде «GPT-4.5 Turbo». Это привело многих к теории, что OpenAI может проводить бета-тестирование GPT-4.5 в основном через свои мобильные приложения. Однако не все пользователи могут воспроизвести эти результаты, часто им говорят, что они используют стандартный GPT-4. Сотрудник OpenAI Уилл Депью охарактеризовал вариации как «очень странные и oddly consistent галлюцинации».

Чеунг указал на пост с официальной страницы ChatGPT на X с эмодзи, изображающими мозг и облака, которые он интерпретирует как тонкое признание OpenAI феномена галлюцинаций. Примечательно, что OpenAI предоставляет ранний доступ платным пользователям, включая ChatGPT Plus, пользователям API для разработчиков и корпоративным клиентам. Учитывая, что именно эти пользователи часто первыми тестируют новые версии и функции GPT, те, кто экспериментирует с производительностью модели, вероятно, обладают какой-либо формой доступа к API для разработчиков.

Даже если OpenAI в настоящее время тестирует GPT-4.5, временные рамки для официальных обновлений остаются неясными, особенно в свете недавних организационных трудностей компании. По мере эволюции продукта становится очевидным, что любая «версия» ChatGPT в использовании может быть менее важной, чем реальные улучшения, которые происходят.

Most people like

Find AI tools in YBX