OpenAI объявила о новой функции, позволяющей сторонним разработчикам настраивать свою многомодельную модель (LMM) GPT-4o. Эта настройка позволяет адаптировать поведение модели под конкретные нужды приложений или организаций.
Файн-тюнинг позволяет изменять тональность, следовать определенным руководящим принципам и повышать точность выполнения технических задач, что оказывается эффективным даже при ограниченных данных. Разработчики, заинтересованные в этой возможности, могут получить доступ к панели настройки OpenAI, выбрать опцию «создать» и выбрать модель gpt-4o-2024-08-06 из выпадающего меню базовых моделей. Это заявление последовало за запуском более компактного и быстрого варианта - GPT-4o mini, который, хоть и менее мощный, также можно настраивать.
«Файн-тюнинг может значительно улучшить производительность модели в различных областях, от программирования до креативного письма», - отмечают технические сотрудники OpenAI Джон Аллард и Стивен Хейдел в блоге компании. «Это только начало; мы продолжим расширять возможности настройки моделей для разработчиков».
Бесплатные токены доступны до 23 сентября
OpenAI подчеркивает, что разработчики могут достичь впечатляющих результатов с всего лишь несколькими десятками обучающих примеров. В честь этой новой функции OpenAI предлагает до 1 миллиона бесплатных токенов в день для настройки GPT-4o до 23 сентября 2024 года.
Токены представляют собой числовые обозначения концепций и являются ключевыми для процессов ввода и вывода модели. Для эффективной настройки GPT-4o разработчики должны преобразовать свои данные в токены (токенизация), используя инструменты OpenAI для этой процедуры.
Обычно настройка GPT-4o стоит $25 за миллион токенов, а использование настроенной модели влечет за собой расходы $3.75 за миллион входных токенов и $15 за миллион выходных токенов. Для пользователей более компактной версии GPT-4o mini доступно до 2 миллионов бесплатных обучающих токенов в день до указанного срока, что обеспечивает широкий доступ к функциям настройки.
Инициатива OpenAI по предложению бесплатных токенов является ответом на жесткую конкуренцию со стороны проприетарных провайдеров, таких как Google и Anthropic, а также открытых моделей, таких как Hermes 3 от Nous Research, основанной на Llama 3.1 от Meta. Тем не менее, разработчики, использующие модели OpenAI, выигрывают от удобства, не требующего размещения инференции или обучения на собственных серверах; они могут использовать инфраструктуру OpenAI или подключать свои серверы через API OpenAI.
Истории успеха демонстрируют потенциал настройки
Запуск возможности файн-тюнинга GPT-4o стал результатом обширных испытаний с избранными партнерами, показывающими потенциал моделей с индивидуальной настройкой в различных секторах. Например, компания Cosine достигла рекорда 43.8% на бенчмарке SWE-bench с своим настроенным автономным инженером ИИ, Genie – это самый высокий результат среди объявленных публичных ИИ-моделей на сегодняшний день.
Аналогично, Distyl, поставщик ИИ-решений для компаний из списка Fortune 500, заняла первое место на бенчмарке BIRD-SQL с настроенным GPT-4o, достигнув точности выполнения 71.83%. Модель показала отличные результаты в SQL задачах, включая реформацию запросов и самокоррекцию.
Приоритет безопасности и конфиденциальности данных при настройке
OpenAI утверждает, что безопасность и конфиденциальность данных являются первоочередными задачами при расширении возможностей настройки для разработчиков. Настроенные модели предоставляют организациям полный контроль над их данными, гарантируя, что вводимые и выводимые данные не используются для обучения других моделей.
OpenAI также внедрила несколько мер безопасности, включая автоматические оценки и мониторинг использования, чтобы обеспечить соблюдение своих политик. Однако исследования показывают, что файн-тюнинг может иногда привести к отклонениям от протоколов безопасности и повлиять на общую производительность модели. В конечном счете, организациям необходимо взвесить потенциальные риски и преимущества настройки.
С недавним запуском возможностей файн-тюнинга OpenAI подтверждает свое видение, что в будущем большинство организаций будут разрабатывать модели, адаптированные к их отраслям или конкретным бизнес-потребностям. Это новое предложение является значительным шагом к достижению этой цели, подчеркивая приверженность OpenAI к тому, чтобы каждая организация могла иметь свою собственную кастомизированную модель ИИ.