OpenAI активно ищет уникальные наборы данных, специфичные для определённых областей, для улучшения своих AI-моделей и более глубокого понимания различных тем и контекстов. Компания представила программу OpenAI Data Partnerships, призывающую к общественным вкладам для сбора как общедоступных, так и частных наборов данных, необходимых для обучения продвинутых моделей, таких как GPT-4 и недавно запущенный GPT-4 Turbo.
OpenAI особенно сосредоточена на курировании крупных наборов данных, которые отражают человеческое общество в формах, недоступных онлайн. Инициатива охватывает широкий спектр медиаконтента, включая текст, изображения, аудио и видео. Организация ищет наборы данных, которые демонстрируют человеческие намерения — длинные литературные произведения или полноценные разговоры, а не разрозненные данные.
В настоящее время OpenAI начала сотрудничество с различными организациями для улучшения языковых возможностей. Например, она работает с правительством Исландии и компанией Miðeind ehf. для разработки специализированного набора данных, направленного на повышение уровня владения GPT-4 исландским языком. Кроме того, партнерство с Free Law Project помогает обогатить обучение AI с помощью обширной коллекции юридических документов, что способствует демократизации доступа к юридическим знаниям.
Цель программы Data Partnerships — предоставить большему числу организаций возможность влиять на развитие AI-технологий, делая их более актуальными и полезными в зависимости от вносимого контента. Эта совместная работа подчеркивает важность взаимодействия с разнообразными наборами данных, отражающими сложность человеческого опыта и потребности общества.
Тем не менее, OpenAI придерживается этических практик в сборе данных. Организация ясно дала понять, что не собирается включать чувствительную личную информацию или данные третьих лиц в свои наборы данных. Основное внимание уделяется созданию открытого набора данных, который может быть использован более широкой AI-сообществом, а также потенциальной подготовке частных наборов для специализированных приложений.
В дополнение к своим инициативам по работе с данными, генеральный директор OpenAI, Сэм Альтман, недавно объявил о планах сотрудничества с корпоративными клиентами для разработки индивидуальных AI-моделей. Несмотря на то, что поначалу эти услуги могут быть недоступны для многих компаний, он подчеркнул потенциал революционных достижений для тех, кто готов инвестировать в эти кастомизированные решения. Альтман также отметил возрастание интереса после анонса новых моделей и обновлений, что привело к повышенному спросу и некоторой волатильности услуг на платформах компании.
В связанном развитии событий OpenAI подтвердила, что ChatGPT подвергся DDoS-атаке, но был восстановлен в полном объёме в течение двух дней. Этот инцидент подчеркивает растущее внимание и использование AI-технологий, а также вызовы, связанные с таким быстрым ростом и интересом.