Parent de TikTok accusé d'utiliser l'API d'OpenAI pour développer des modèles concurrents.

ByteDance, la société mère de TikTok, serait en violation des conditions d'utilisation d'OpenAI en utilisant sa technologie pour créer des modèles de langage concurrents. Selon The Verge, ByteDance exploite l'API d'OpenAI pour recueillir des données en vue du développement de son propre modèle fondamental, actuellement désigné sous le nom de Projet Seed. Avec un historique d'innovation dans l'IA générative, les chercheurs de ByteDance se concentrent sur des modèles de génération 3D sophistiqués.

Les politiques d'OpenAI interdisent explicitement l'utilisation des résultats de modèles tels que GPT-4 pour créer des systèmes rivaux. Cependant, ByteDance accéderait à la technologie d'OpenAI via Microsoft, un fournisseur ayant des restrictions similaires, et aurait régulièrement dépassé les limites d'utilisation de son API. Des rapports indiquent que cette API a été essentielle durant les phases de développement de Projet Seed, englobant l'entraînement et l'évaluation des modèles.

D'après des informations obtenues par The Verge, des discussions entre employés sur Lark, la plateforme de messagerie interne de ByteDance, ont révélé des efforts pour « blanchir » les preuves d'un prétendu abus de la technologie d'OpenAI. Les développeurs de l'entreprise, principalement basés en Chine, auraient masqué leur utilisation de l'API d'OpenAI en recourant à des techniques de désensibilisation des données, généralement utilisées pour protéger des informations sensibles.

En réponse à ces allégations, OpenAI a confirmé que l'accès de ByteDance à son compte ChatGPT a été suspendu pendant qu'une enquête est en cours. Un porte-parole de ByteDance a souligné l'engagement de l'entreprise à respecter les directives d'utilisation d'OpenAI, déclarant : « Nous utilisons GPT pour améliorer des produits et des fonctionnalités sur des marchés en dehors de la Chine, tandis que notre modèle développé en interne alimente Doubao, qui est exclusif à la Chine. »

Doubao est le système d'IA conversationnelle de ByteDance, permettant aux utilisateurs d'interagir via des images et du texte. Le porte-parole a affirmé qu'un groupe restreint d'ingénieurs avait auparavant utilisé l'API d'OpenAI pour « un petit modèle expérimental interne qui n'a jamais été lancé ». Cette pratique aurait été interrompue en avril, avec l'établissement de nouveaux protocoles internes pour garantir que le texte généré par les modèles GPT ne soit pas intégré dans les ensembles de données d'entraînement des modèles propriétaires de ByteDance.

De plus, ByteDance a indiqué que son équipe d'ingénierie utilise désormais principalement l'API GPT de manière restreinte lors des processus d'évaluation et de test, comme le benchmarking. L'entreprise a mis en place des mesures de conformité, y compris des échantillonnages par lots et des comparaisons de similarité entre ses données étiquetées et les résultats d'OpenAI afin de réduire le risque d'utilisation inappropriée par les annotateurs de données.

Suite à la montée en popularité de ChatGPT, de grandes entreprises technologiques chinoises, y compris ByteDance, Baidu et Alibaba, se sont lancées dans la course au développement de leurs propres modèles de langage. Récemment, la Chine a dévoilé un nouveau superordinateur conçu pour renforcer les efforts locaux dans l'entraînement de modèles d'IA, soulignant davantage le paysage concurrentiel dans le secteur de l'intelligence artificielle.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles