Apple a conclu un accord de licence essentiel avec le fournisseur de photos de stock Shutterstock, lui permettant d'accéder à des millions d'images pour former ses modèles d'intelligence artificielle (IA). Selon Reuters, cet accord est évalué entre 25 et 50 millions de dollars, plaçant Apple aux côtés d'autres géants technologiques comme Meta, Google et Amazon dans la quête de données étendues pour le développement de l'IA.
Des sources internes ont révélé à Reuters qu'Apple a récemment rejoint ces entreprises pour signer des accords de licence avec Shutterstock, accordant l'accès à des centaines de millions d'images, de vidéos et de fichiers musicaux. Bien que les termes spécifiques de l'accord d'Apple restent confidentiels, le directeur financier de Shutterstock, Jarrod Yahes, a confirmé que les premiers accords avec ces entreprises technologiques variaient de 25 à 50 millions de dollars, avec une tendance à s'étendre par la suite.
La demande de données pour la formation des IA a donné naissance à un marché florissant, avec diverses entreprises se procurant du contenu par différents biais. Des entretiens avec plus de 30 acteurs de l'industrie ont révélé que les prix varient considérablement selon le type de contenu et l'acheteur. Par exemple, la PDG de Defined.ai, Daniela Braga, a noté que le coût typique est de 1 à 2 dollars par image, de 2 à 4 dollars par vidéo courte, et de 100 à 300 dollars par heure pour des films plus longs, avec des tarifs pour le texte autour de 0,001 dollar par mot.
Préoccupations de Confidentialité et Défis Juridiques
Alors que la technologie IA évolue rapidement, les inquiétudes concernant l'utilisation des données pour entraîner des modèles se sont intensifiées. Des entreprises majeures comme OpenAI, Google, Meta et Microsoft ont utilisé d'énormes quantités de données en ligne, y compris des matériaux protégés par le droit d'auteur, souvent sans autorisation ni compensation pour les créateurs originaux. Cela a suscité un fort retour de la part des éditeurs et des créateurs de contenu, qui affirment que leur propriété intellectuelle est exploitée. Récemment, le New York Times a intenté une action en justice contre OpenAI et Microsoft pour violation du droit d'auteur, alléguant que des millions de ses articles ont été utilisés pour former des chatbots qui rivalisent maintenant avec le journal. Cette plainte réclame des milliards en dommages et intérêts et l'arrêt des modèles d'IA intégrant le contenu du NYT.
Face à ces litiges, des appels à un système de licence où les entreprises d'IA compenseraient les propriétaires de contenu pour l'accès aux données de formation se font entendre. Lors d'une audition au Sénat, des législateurs, de tous bords, ont exprimé leur soutien aux demandes de l'industrie des médias, plaidant pour des accords de licence pour le développement de l'IA. Des responsables d'organisations comme la National Association of Broadcasters et le News Media Alliance ont exprimé leur soutien à un système de licence obligatoire, arguant que l'utilisation non autorisée des données enfreint le droit d'auteur.
En revanche, OpenAI et certains experts soutiennent qu'une licence complète pourrait être impraticable. Ils affirment que de telles exigences pourraient concentrer le pouvoir entre les mains des grandes entreprises technologiques et poser des défis aux startups d'IA plus petites, ce qui suscite un débat sur la nécessité de rendre la licence une obligation légale ou de la maintenir comme une norme de l'industrie.
Alors que le paysage juridique évolue, certaines entreprises sécurisent des accords de données lucratifs. Par exemple, Google aurait signé un contrat annuel de 60 millions de dollars pour un accès exclusif aux données de Reddit pour ses systèmes d'IA. Avec l'intensification des préoccupations en matière de confidentialité, les dynamiques changeantes des données de formation à l'IA seront cruciales pour l'avenir de l'industrie.
La Quête de la Dominance en IA
L'accord avec Shutterstock souligne le rôle essentiel des données dans l'évolution des systèmes d'IA avancés. Alors qu'Apple, Google et Meta s'affrontent pour développer des modèles d'IA de pointe, l'accès à des ensembles de données vastes et diversifiés devient de plus en plus vital. En licenciant des millions d'images de Shutterstock, Apple cherche à renforcer ses capacités en IA dans diverses applications, notamment la vision par ordinateur, la génération d'images, les assistants virtuels et la réalité augmentée.
Cette volonté des géants de la technologie d'investir des dizaines de millions dans les données de formation de l'IA souligne le potentiel économique considérable de cette technologie. Alors que l'IA devient essentielle dans des secteurs tels que la santé, la finance, le divertissement et l'éducation, le marché des solutions alimentées par l'IA devrait connaître une croissance exponentielle dans les années à venir. En investissant massivement dans l'IA dès maintenant, Apple et ses pairs se positionnent pour capturer une part substantielle de ce marché en expansion.
Bien qu'Apple n'ait pas divulgué de détails spécifiques concernant l'accord avec Shutterstock, l'entreprise a affirmé son engagement à développer des systèmes d'IA de manière réfléchie et éthique, mettant en avant son respect des droits de propriété intellectuelle.
Le marché des données IA, actuellement évalué à environ 2,5 milliards de dollars et projeté pour atteindre près de 30 milliards dans une décennie, reflète les enjeux élevés dans la compétition pour la suprématie de l'IA parmi les leaders technologiques. Alors que l'industrie navigue dans les complexités de ce paysage axé sur les données, les conséquences à long terme pour la vie privée des utilisateurs et les droits des données se profilent à l'horizon.