Таинственная модель ИИ 'gpt2-chatbot' поражает экспертов: настоящая инновация или всего лишь hype?

Верифицированный аккаунт на X (ранее Twitter), представляющий Организацию крупных модельных систем, объявил о временном удалении gpt2-chatbot из-за «неожиданно высокого трафика» и «ограничений мощности». Организация отметила сотрудничество с различными разработчиками моделей для предоставления сообществу доступа к нераспределенным моделям для тестирования, включая gpt2-chatbot.

Новая система искусственного интеллекта под названием «gpt2-chatbot» появилась в интернете, вызвав широкий интерес к своим происхождению и возможностям. Многие исследователи полагают, что она представляет собой значительное advancement по сравнению с существующими ИИ-моделями.

Модель возникла на платформе LMSYS Chatbot Arena, сайте, посвященном сравнению языковых систем ИИ. Однако ее производительность привлекла внимание экспертов ИИ, которые предполагают, что она может соперничать или даже превосходить GPT-4, последнюю систему, разработанную OpenAI.

Исследователь ИИ Эндрю Гао из Стэнфордского университета отметил: «Невозможно установить, кто её создал, но я согласен, что она выглядит как минимум на уровне GPT-4». Примечательно, что gpt2-chatbot успешно решила задачу из Международной математической олимпиады — достижение, которое Гао подчеркивает как впечатляющее с учетом сложности соревнования.

Профессор Уортонской школы Итан Моллик, изучающий ИИ, отметил, что в его тестах gpt2-chatbot превзошла GPT-4 в сложных задачах, таких как кодирование эскиза единорога. Он заметил: «Она может быть лучше, чем GPT-4, особенно в сложной задаче 'нарисовать единорога с помощью кода'».

Удивительные возможности модели привели к бурным спекуляциям о ее происхождении. Многие исследователи подозревают, что gpt2-chatbot была разработана OpenAI, учитывая, что она сама себя идентифицирует как «ChatGPT, большая языковая модель, обученная OpenAI на базе архитектуры GPT-4». Однако это утверждение сложно проверить, поскольку системы ИИ могут быть спроектированы так, чтобы вводить в заблуждение относительно своего происхождения.

Некоторые эксперты отметили схожесть с предыдущими моделями OpenAI как знак ее создателей. «Она утверждала, что была разработана OpenAI», — заметил Гао, хотя он предостерег, что это может быть вводящим в заблуждение индикатором из-за загрязнения данных при обучении на чатах, происходящих от OpenAI.

Несмотря на очевидное сходство с GPT-4, некоторые исследователи предполагают, что gpt2-chatbot не значительно превосходит возможности GPT-4. Другой исследователь ИИ Джо Фокс отметил, что, хотя gpt2-chatbot впечатляет, она может не представлять собой большой скачок по сравнению с GPT-4 в практических приложениях.

Также существует вероятность, что gpt2-chatbot появилась от менее известной организации, стремящейся продемонстрировать свои возможности в ИИ. Этот сценарий напоминает выпуск GPT-4chan исследователем ИИ Янником Килчером в июне 2022 года — модели с похожей схемой названия, но без аффилиации с OpenAI.

Исследуя функции gpt2-chatbot, ученые обнаружили поведения, указывающие на ее потенциальные возможности. Примечательно, что модель кажется более склонной к нарушению правил, чем предыдущие чат-боты. Димитрис Папаилиопулос, профессор ИИ в Университете Висконсин, обнаружил, что gpt2-chatbot смогла решить логическую задачу, с которой GPT-4 не справилась. «Я нашел задачу, в которой gpt2-chatbot превосходит все другие модели, хотя она и тривиальная», — с юмором заметил он.

Кроме того, модель продемонстрировала высокую квалификацию в задачах кодирования. Чейс Макай, инженер-основатель CodeGen, сообщил, что gpt2-chatbot превзошла как GPT-4, так и Claude Opus во всех оценках кодирования, использованных для тестирования модели. «Ее производительность действительно заслуживает внимания», — заявил он.

Некоторые пользователи отметили, что gpt2-chatbot может вести итеративный диалог для улучшения своих ответов, проявляя осознание своих ограничений. Гао заметил: «Кажется, она превосходит GPT-4 в стратегическом мышлении, создавая конкретные сайты и поисковые запросы, тогда как GPT-4 склонен давать более неопределенные ответы».

Быстрая эволюция искусственного интеллекта очевидна в появлении gpt2-chatbot. Четыре года назад GPT-4 представлял собой значительное улучшение в здравомыслии ИИ. Ее конкурент Claude 3 от Anthropic также раздвинул границы в ведении открытых бесед.

С продолжающимся развитием моделей с открытым исходным кодом и тонкой настройкой существующих систем, ИИ-пространство быстро меняется, позволяя командам любого размера создавать и выпускать инновационные модели с минимальными предостережениями. Появление gpt2-chatbot вызвало переполох среди исследователей и подчеркнуло стремительные достижения в области ИИ.

Хотя полные последствия gpt2-chatbot остаются неопределенными, ее неожиданный запуск и продвинутые возможности могут предвещать новую эру в ИИ, где прорывы часто возникают без предупреждения из глубин интернета.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles