Материнская компания TikTok обвиняется в использовании API OpenAI для разработки конкурирующих моделей.

ByteDance, материнская компания TikTok, предположительно нарушает условия обслуживания OpenAI, используя её технологии для создания конкурирующих языковых моделей. Согласно сообщению The Verge, ByteDance использует API OpenAI для сбора данных для разработки своей собственной базовой модели, известной как Project Seed. Исследователи ByteDance, обладая опытом в области генеративного ИИ, сосредоточили свои усилия на сложных 3D моделях.

Правила OpenAI явно запрещают использование выводов из моделей, таких как GPT-4, для создания конкурентных систем. Тем не менее, ByteDance, как сообщается, получает доступ к технологиям OpenAI через Microsoft — поставщика с аналогичными ограничениями — и постоянно превышает лимиты использования своего API. По данным, API стал ключевым инструментом на этапах разработки Project Seed, включая обучение модели и её оценку.

Согласно информации, опубликованной The Verge, обсуждения сотрудников на внутренней платформе Lark выявили попытки «прикрыть» доказательства предполагаемого злоупотребления технологиями OpenAI. Разработчики компании, в основном находящиеся в Китае, предположительно скрывали использование API OpenAI с помощью методов десенсибилизации данных, обычно применяемых для защиты конфиденциальной бизнес- или личной информации.

В ответ на эти обвинения OpenAI подтвердила, что доступ ByteDance к своему аккаунту ChatGPT был приостановлен до завершения расследования. Представитель ByteDance подчеркнул приверженность компании соблюдению инструкций OpenAI, заявив: «Мы используем GPT для улучшения продуктов и функций на рынках вне Китая, в то время как наша собственная модель поддерживает Doubao, которая эксклюзивна для Китая.»

Doubao — это система разговорного ИИ от ByteDance, которая облегчает взаимодействие пользователей с помощью изображений и текста. Представитель компании заявил, что ограниченная группа инженеров ранее использовала API OpenAI для «внутренней небольшой экспериментальной модели, которая никогда не была запущена». Эта практика, по его словам, была прекращена в апреле, и были введены новые внутренние протоколы, чтобы гарантировать, что текст, сгенерированный моделями GPT, не попадает в учебные наборы данных собственных моделей ByteDance.

ByteDance также сообщила, что её инженерная команда теперь в основном использует API GPT в ограниченном объёме в процессе оценки и тестирования, например, для бенчмаркинга оценок. Компания внедрила меры для обеспечения соблюдения требований, включая выборочное тестирование и сравнение сходства своих размеченных данных с выводами OpenAI, чтобы минимизировать риск ненадлежащего использования со стороны аннотаторов данных.

После роста популярности ChatGPT крупные китайские технологические компании, включая ByteDance, Baidu и Alibaba, стремятся разработать собственные языковые модели. На днях Китай представил новый суперкомпьютер, предназначенный для усиления местных усилий в области обучения ИИ-моделей, что подчеркивает конкурентные условия в секторе искусственного интеллекта.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles