Запуск ChatGPT привлек внимание пользователей своими впечатляющими способностями в области естественного языка, опираясь на ранее созданную модель GPT-3.5. Однако появление долгожданного GPT-4 изменило представления о возможности искусственного интеллекта, став одним из первых шагов к искусственному общему интеллекту (AGI).
Что такое GPT-4?
GPT-4 — это последняя языковая модель от OpenAI, способная генерировать текст, максимально приближенный к человеческому. Эта модель улучшает технологию ChatGPT, переходя от GPT-3.5 к более продвинутой системе. "Generative Pre-trained Transformer" (GPT) представляет собой архитектуру глубокого обучения, использующую искусственные нейронные сети для имитации человечески подобного письма.
OpenAI подчеркивает, что GPT-4 превосходит ChatGPT в трех ключевых аспектах: креативности, работе с визуальными данными и обработке более длинных контекстов. В области креативности GPT-4 демонстрирует выдающиеся результаты в создании и сотрудничестве над проектами в различных форматах, включая музыку, сценарии, технические тексты и даже адаптацию к уникальному стилю письма пользователя.
Способность обрабатывать длинные контексты также важна. GPT-4 может обрабатывать до 128 000 токенов пользовательского ввода и даже взаимодействовать с текстами из веб-ссылок, что значительно увеличивает его возможности в создании длинного контента и поддержании длительных бесед.
Кроме того, GPT-4 может обрабатывать изображения, позволяя ему реагировать на визуальные подсказки. Например, он может проанализировать фото ингредиентов для выпечки и предложить рецепты на основе увиденного. Однако неясно, поддерживает ли он ввод видео в том же формате.
Важно отметить, что GPT-4 разработан для значительного повышения безопасности по сравнению со своим предшественником. Внутри модель предоставляет на 40% больше точных ответов и на 82% реже взаимодействует с запросами на запрещенный контент. Это достижение стало возможным благодаря обширному обучению с использованием обратной связи от человека и сотрудничества с более чем 50 экспертами, особенно в области безопасности ИИ.
В недели после запуска пользователи продемонстрировали удивительные применения GPT-4 — в частности, создание новых языков, разработку сложной анимации и даже программирование работающей версии Pong всего за шестьдесят секунд с использованием HTML и JavaScript.
Как использовать GPT-4?
GPT-4 доступен всем пользователям на разных тарифах OpenAI. Пользователи бесплатного тарифа имеют ограниченный доступ — порядка 80 чатов в течение трех часов, после чего они переключаются на менее мощный GPT-4o mini до сброса лимита. Для расширенного доступа к GPT-4 и генерации изображений с помощью DALL-E пользователи могут оформить подписку ChatGPT Plus за $20 в месяц. Апгрейд осуществляется просто: достаточно нажать «Upgrade to Plus» в боковом меню ChatGPT, ввести данные кредитной карты и переключаться между GPT-4 и предыдущими моделями.
Для тех, кто не хочет подписываться, Bing Chat от Microsoft предлагает возможность бесплатно испытать возможности GPT-4. Microsoft интегрировала GPT-4 в Bing Chat, хотя некоторые функции могут отсутствовать, а сервис включает оригинальные улучшения Microsoft. Хотя Bing Chat остается бесплатным, он ограничен 15 чатами за сессию и 150 сессиями в день.
Разнообразие других приложений также использует GPT-4, включая платформу Quora, популярный сервис вопросов и ответов.
Когда был выпущен GPT-4?
GPT-4 был официально представлен 13 марта, после подтверждения от Microsoft перед релизом. Изначально он стал доступен подписчикам ChatGPT Plus и через Microsoft Copilot, а также доступен как API для разработчиков. Такие компании, как Duolingo, Be My Eyes, Stripe и Khan Academy, уже интегрировали GPT-4 в свои сервисы. Первую публичную демонстрацию возможностей GPT-4 транслировали в прямом эфире на YouTube.
Что такое GPT-4o Mini?
GPT-4o mini — последняя версия модели GPT-4 от OpenAI, оптимизированная для более простых задач с высоким объемом, при этом основной акцент делается на быстроту вывода, а не на полные возможности модели. Выпущенная в июле 2024 года, GPT-4o mini заменила GPT-3.5 в качестве основной модели, как только пользователи превышают трехчасовой лимит запросов с GPT-4o.
GPT-4 лучше, чем GPT-3.5?
Ранее бесплатная версия ChatGPT базировалась на GPT-3.5. Однако с июля 2024 года ChatGPT использует GPT-4o mini, который демонстрирует более высокую производительность даже по сравнению с GPT-3.5 Turbo. Он лучше понимает и отвечает на большее количество запросов, предлагает дополнительные меры безопасности, дает более лаконичные ответы и на 60% эффективнее в плане затрат.
API GPT-4
Для разработчиков GPT-4 доступен в виде API, при условии, что они ранее совершили хотя бы один успешный платеж в OpenAI. API включает различные версии GPT-4 наряду с устаревшими моделями GPT-3.5. OpenAI сообщила, что в то время как GPT-3.5 останется доступным, он будет постепенно выводиться из эксплуатации, хотя конкретный график этой замены пока не определен.
API в первую очередь предназначен для разработчиков, создающих новые приложения, но некоторые пользователи испытывали путаницу. Например, Plex упрощает интеграцию ChatGPT в свой музыкальный плеер Plexamp, требуя отдельного API-ключа ChatGPT, отличного от ChatGPT Plus. Поэтому для доступа к API необходимо зарегистрироваться как разработчик.
Становится ли GPT-4 хуже?
Несмотря на первоначальную похвалу GPT-4 после релиза, некоторые пользователи сообщили о снижении качества ответов в последующие месяцы. Обсуждения среди заметных фигуры в разработческой среде привели к обсуждениям на форумах OpenAI. Один из руководителей OpenAI утверждает, что эти опасения в основном необоснованны, и что любое воспринимаемое ухудшение носит субъективный характер, добавляя, что новые версии модели постоянно совершенствуются.
Однако одно исследование указывает на то, что в этих опасениях есть доля правды, указав на снижение точности с 97.6% в марте до 2.4% в июне. Хотя этот вывод не является окончательным, он поддерживает утверждения о том, что пользователи действительно сталкиваются с изменениями в производительности.
Где визуальный ввод в GPT-4?
Одной из самых ожидаемых функций GPT-4 является способность обрабатывать визуальные данные, превращая ChatGPT в по-настоящему мультимодальную модель. Загружать изображения для анализа так же просто, как прикреплять документы: пользователям нужно только нажать на иконку скрепки в окне контекста, выбрать источник изображения и прикрепить его для получения осмысленных ответов.
Каковы ограничения GPT-4?
Несмотря на утверждения OpenAI об улучшениях GPT-4, модель по-прежнему сталкивается с определенными ограничениями. Как и ее предшественники, GPT-4 испытывает проблемы, связанные с социальными предвзятостями, неточностями и трудностями, вызванными противоречивыми запросами. Поэтому она не является безошибочной. Многие случаи в Интернете подчеркивают эти недостатки, но OpenAI утверждает, что продолжает работать над их устранением. В целом, GPT-4 значительно реже выдает вымышленные данные по сравнению с предыдущими моделями.
Еще одним заметным ограничением является то, что обучающие данные GPT-4 охватывают информацию только до декабря 2023 года, тогда как GPT-4o и 4o mini имеют предел в октябре 2023 года. Тем не менее, возможности веб-поиска GPT-4 позволяют ему находить и извлекать более свежую информацию из Интернета. С выходом GPT-4o пользователи могут ожидать появления следующей модели GPT-5.