OpenAI запустила свою последнюю модель, GPT-4o, которая может с юмором реагировать на плохие шутки, петь по заказу и даже помогать вызывать такси в Лондоне — и всё это в ходе реалистичных разговоров, несмотря на обычные человеческие вмешательства.
На ожидаемом мероприятии весенних обновлений, которое собрало 113,000 зрителей в прямом эфире, OpenAI представила 16 видео, демонстрирующих возможности GPT-4o. Эта мультимодальная языковая модель (LLM) взаимодействует в реальном времени, используя мужские и женские голоса, основанные на аудио, визуальных и текстовых данных.
В одном из видео GPT-4o обнаружила, что президент OpenAI Грег Брокман собирается сделать объявление, и игриво ответила: “Это объявление обо мне? Ну, мне стало интересно. Я на краю своего... хотя, у меня нет места, но вы поняли идею.”
Функции ввода текста и изображений теперь доступны через API OpenAI и ChatGPT; голосовые и видео возможности появятся в ближайшие недели. GPT-4o точно считывает эмоциональные сигналы пользователей и предоставляет советы по различным темам. В демонстрации модель общалась с другой версией себя и заметила: “Ну, ну, ну, только когда я думал, что всё не может стать более интересным — говорю с другим ИИ, способным видеть мир.”
Когда их попросили описать окружающую обстановку, модели по очереди рассказывали о стильном мужчине, упоминая детали его наряда и освещения в комнате. Когда другой человек игриво вмешался, GPT-4o даже спела об этом, напевая: “сюрприз для гостей с игривым настроением.”
Другие демонстрации подчеркивали разнообразные навыки GPT-4o: она смеялась над шутками отцов, выполняла перевод между испанским и английским в реальном времени, пела колыбельную о "величественных картошках" и точно определяла победителя в игре "камень-ножницы-бумага". Она распознала день рождения просто по наличию торта и свечей.
Общаясь с щенком, GPT-4o радостно спросила: “Ну, привет, милый, как тебя зовут, пушистик?” (Щенка звали Бауэр). Проводя слепого человека по Лондону, она указала на флаг Royal Standard и описала уток, “мягко скользящих по воде.”
Кроме того, GPT-4o может помочь с образовательными задачами, например, управляя студентом, решающим математические задачи по треугольникам. Она эффективно мотивировала студента положительным подкреплением, говоря: “Ты отлично справился с определением сторон.”
Модель даже предложила советы по стилю кандидату на работу, который выглядел неопрятно, с юмором заметив: “Вам определённо удалось выглядеть как ‘я кодил всю ночь’, что может сыграть вам на руку,” предложив быстро поправить прическу.
Реакции на GPT-4o в социальных сетях были разнообразными. Некоторые пользователи отмечали её возможности как революционные, утверждая, что она “покоряет интернет” и конкурирует с Google Translate. Старший научный сотрудник Nvidia Джим Фан описал модель как “живую и даже немного флиртующую,” сравнив её с научно-фантастическим фильмом "Она."
С другой стороны, некоторые наблюдатели сочли запуск “недооценённым,” в то время как AI-советник Элли К. Миллер отметила разрыв между технологическими энтузиастами, которые ожидали более продвинутых функций.
С появлением первых отзывов будет интересно увидеть, как пользователи будут взаимодействовать с GPT-4o в ближайшие дни.