Apple Répond à la Controverse sur l'Utilisation des Sous-titres YouTube pour la Formation de l'IA
Le 18 juillet, un rapport a révélé que des géants technologiques tels qu'Apple et Nvidia avaient utilisé les sous-titres YouTube pour former leurs modèles d'intelligence artificielle, suscitant d'intenses débats. Apple a depuis clarifié l'intention et la nature de son utilisation des données.
L'entreprise a confirmé avoir utilisé des ensembles de données YouTube pour entraîner son modèle OpenELM en open-source, lancé en avril de cette année. Cependant, Apple a souligné qu'OpenELM n’est pas utilisé pour alimenter ses fonctionnalités d’IA ou d’apprentissage automatique, y compris le service « Apple Intelligence ». Le modèle a été principalement développé pour faire avancer la recherche technologique et favoriser la croissance des modèles de langage open-source. Les chercheurs d'Apple ont décrit OpenELM comme « un modèle de langage open-source à la pointe de la technologie ».
Selon la déclaration d'Apple, le développement d'OpenELM a été dédié à des fins de recherche et il est publié en open-source, le rendant accessible à un large éventail de chercheurs. Étant donné qu'OpenELM est distinct des services d'IA d'Apple, cela signifie que les données de sous-titres YouTube n'ont pas été utilisées dans la formation de ces services.
De plus, Apple a noté que ses modèles de services d'IA sont entraînés sur des « données sous licence », comprenant des données sélectionnées pour améliorer des fonctionnalités spécifiques et des données publiquement accessibles collectées via ses robots d'exploration web. L'entreprise a également indiqué qu'elle n'avait actuellement aucun projet de développer une nouvelle version du modèle OpenELM.