Le pionnier de la technologie de jeu AI de Nvidia vise à clarifier les controverses entourant ses inventions.

Plus tôt ce mois-ci, j'ai été témoin d'une avancée technologique remarquable. Lors d'une conférence de presse précédant le CES, Nvidia a dévoilé une démonstration de son microservice Ace, une suite d'IA capable de créer des personnages IA entièrement vocalisés. J'ai été émerveillé de voir un présentateur interagir avec un NPC en jeu par le biais d'un microphone, recevant des réponses en temps réel et d'un réalisme saisissant. Cela semblait tout droit sorti d'un film de science-fiction, mais une question demeurait : comment était-ce possible ?

La réponse de Nvidia était vague, indiquant qu'il n'y avait "pas de réponse simple". Cette ambiguïté a suscité d'intenses spéculations sur les réseaux sociaux, de nombreux utilisateurs exprimant des inquiétudes sur le fait qu'Ace pourrait avoir été entraîné avec du contenu dont Nvidia ne disposait pas des droits. Bien que Nvidia ait ensuite précisé qu'elle n'utilisait que des données légalement acquises, l'incertitude persistait. Les joueurs restaient méfiants, luttant avec des questions éthiques et artistiques entourant cette technologie.

Nous avons aussi observé cette dynamique, Purnendu Mukherjee, ingénieur logiciel et esprit derrière la technologie IA au cœur de cette controverse. Il est le fondateur de Convai, la société d'IA générative responsable de la démonstration Kairos de Nvidia au CES 2024. Plutôt que de rester silencieux face à la réaction, Mukherjee a saisi l'occasion de clarifier les malentendus.

Dans une interview approfondie, Mukherjee a abordé diverses préoccupations éthiques concernant les outils d'IA comme sa création. Il a traité de sujets allant de la peur de la perte d'emplois aux craintes que l'IA ne mine le toucher humain dans l'art. Contrairement à ces inquiétudes, Mukherjee envisage un avenir où les artistes collaboreraient avec l'IA pour enrichir leurs expressions créatives. Cependant, ses idées sur l'utilisation des données soulèvent d'autres questions.

La fascination de Mukherjee pour l'esprit humain a commencé dans son enfance, l'amenant à explorer l'IA dès le lycée. Découragé au départ par des systèmes rigides, son intérêt a repris en 2015 lorsqu'il s'est plongé dans l'apprentissage profond dans un laboratoire en Inde. Après des études supérieures et une expérience chez Nvidia, il a lancé Convai en avril 2022, finançant la start-up par ses propres moyens durant les dix premiers mois.

Passionné de jeux vidéo depuis son enfance, Mukherjee a grandi en jouant à des jeux compétitifs comme Counter-Strike dans un café internet local, où il a d'abord imaginé comment l'IA pourrait améliorer le gameplay. Ce qui a commencé comme une critique humoristique des bots de jeu rudimentaires a évolué en une innovation révolutionnaire. La technologie de Convai utilise plusieurs processus d'IA pour générer des NPC entièrement vocalisés, capables de répondre dynamiquement aux incitations des joueurs, visant à offrir des expériences de jeu plus captivantes.

"Considérez des titres comme Baldur's Gate 3 ou The Witcher," explique Mukherjee. "Ces jeux ont des récits riches et des arcs de personnages profonds. Cependant, les joueurs passent souvent à côté de la possibilité d'explorer pleinement ces histoires en raison des options de dialogue limitées avec les NPC. Grâce à la technologie actuelle, nous pouvons donner vie aux NPC, leur permettant d'interagir avec les joueurs et de fournir des perspectives plus profondes sur l'histoire."

Ce sentiment ouvre un débat plus large, alors que Mukherjee aborde des préoccupations interconnectées concernant l'IA. En discutant de l'impact de Baldur’s Gate 3 sans son dialogue soigneusement élaboré, nous plongeons dans la relation complexe entre le contenu généré par machine et l'intégrité artistique. Mukherjee aborde le scepticisme de front, soulignant que l'IA ne remplace pas les artistes, mais constitue un outil qui nécessite leur contribution.

"Je crois que les concepteurs narratifs seront plus demandés, pas moins," déclare-t-il, décrivant comment l'IA pourrait créer des rôles supplémentaires pour les écrivains. "Les écrivains doivent rédiger des backstories et des récits tout en développant des ensembles de tests robustes. Pour assurer qu'un NPC basé sur l'IA générative puisse être intégré en toute confiance dans un jeu à plusieurs millions de dollars, des centaines, voire des milliers d'interactions sont nécessaires, idéalement élaborées par l'écrivain narratif d'origine. Notre plateforme exige que les utilisateurs fournissent une histoire approfondie et des documents, ce qui conduit finalement à beaucoup plus de rédaction que ce qui est normalement effectué."

Cette perspective devient un thème récurrent dans notre dialogue. Mukherjee affirme répétitivement que les outils d'IA générative nécessiteront un nombre encore plus important d'artistes pour être formés efficacement. Il suggère qu'une IA améliorée rehaussera la qualité des jeux, entraînant des ventes accrues et des salaires plus élevés pour les doubleurs, qui jouent un rôle essentiel dans le développement de ces outils avancés. Son point de vue est optimiste, surtout face à la vague actuelle de licenciements dans l'industrie du jeu vidéo.

Mukherjee reconnaît la réalité de ces licenciements, mais considère l'essor de l'IA générative comme une part d'une évolution technologique naturelle. Il pense que les créateurs devront s'adapter et embrasser des synergies collaboratives avec l'IA plutôt que de la voir comme une menace.

"Vous restez le créateur, le maître et le contrôleur de cela," affirme-t-il.

Alors que nous poursuivons, je lui demande ce qu'il pense des artistes qui créent des jeux avec passion. Est-il vraiment aussi simple de suggérer qu'ils pivotes pour devenir ingénieurs en IA ? Mukherjee répond que c'est davantage une question de reconnaître l'intersection entre art et technologie.

"L'IA est comparable à des outils comme Adobe Photoshop ou Unreal Engine," explique-t-il. "Oui, les jeux existaient avant ces technologies, et les créateurs les fabriquaient toujours à la main. Mais pouvez-vous produire une art extraordinaire avec Unreal Engine ? Absolument. Le niveau de détail dans le montage vidéo 3D reste intact, même avec du contenu généré par IA. L'essence de l'artisanat est toujours présente; elle est simplement améliorée par des outils plus puissants. Vous êtes toujours le créateur, celui qui façonne sa vision."

Mukherjee voit clairement l'IA comme un atout pour les artistes plutôt qu'un substitut. Il réitère plusieurs points clés concernant la dépendance de l'IA à la créativité humaine tout en abordant les préoccupations prédominantes. Pourtant, la question de l'utilisation des données reste controversée. Bien que les critiques soutiennent que les modèles d'IA entraînés sur leur travail volent la propriété intellectuelle, certains développeurs insistent sur la nécessité d'importantes données—including du matériel protégé par le droit d'auteur—pour entraîner des modèles efficaces. Mukherjee suggère que les créateurs devraient être rémunérés lorsque leurs contributions influencent les jeux de données de formation de l'IA.

"Un système doit être mis en place pour garantir que les personnes qui apportent des données significatives soient justement compensées," déclare-t-il. "Que ce soit le New York Times ou Reddit, un licensing approprié est essentiel. C'est une question complexe, mais je crois que c'est la direction que nous devons prendre, en particulier pour les applications commerciales."

Interrogé sur les pratiques de données de Convai, Mukherjee souligne que la société n'utilise que des données dont elle détient les droits. Il explique qu'il serait impossible de rassembler au hasard les données spécifiques nécessaires, étant donné que la technologie ouvre un nouveau domaine. Cependant, il aborde rapidement un paradoxe dans cet argument.

"Nous utilisons des modèles de base issus de sources comme OpenAI ou des modèles open-source sous licence," clarifie-t-il. "Celle-ci doit être éthique et commercialement agréée. Nous sommes méticuleux dans ces processus. En fait, notre système nécessite souvent plus de doubleurs, pas moins !"

La mention d'OpenAI soulève certaines inquiétudes, surtout au regard de ses récentes difficultés juridiques liées à la plainte du New York Times concernant l'utilisation présumée "illégale" de ses écrits pour entraîner des bots comme ChatGPT. OpenAI reconnaît la difficulté d'entraîner des modèles IA avancés sans utiliser du matériel protégé par le droit d'auteur. Étant donné que le modèle de Convai est construit sur le travail d'OpenAI, je presse Mukherjee sur la manière dont il peut garantir qu'aucun contenu protégé n'a été impliqué dans leur formation.

Mukherjee fait une distinction subtile : Convai n'utilise pas directement les données d'OpenAI, mais seulement les modèles développés à partir de celles-ci. Cette nuance pourrait suggérer une échappatoire légale. Mukherjee est convaincu que puisque Convai s'abstient d'utiliser directement les données, il reste conforme aux questions de droit d'auteur. Cependant, quand on lui demande d'éclaircir la distinction entre l'utilisation de modèles et l'utilisation de jeux de données potentiellement protégés au sein de ces modèles, son explication devient moins claire.

"Il est ambigu de savoir quel modèle contient quelles données," admet-il. "Nous n'avons pas cette clarté. Par exemple, si OpenAI fournit cinq modèles, Nvidia quatre, et Meta trois, nous utilisons simplement ceux qui répondent le mieux à nos besoins, sans connaître leurs origines exactes en matière de données."

Le raisonnement de Mukherjee laisse entendre que Convai ne porte pas la responsabilité de la gestion des données d'autres modèles. Son attention se concentre uniquement sur l'assurance que les pratiques de Convai demeurent éthiques tout en espérant que les modèles fondamentaux le soient également. Pourtant, son affirmation précédente selon laquelle Convai travaillerait avec les modèles les plus éthiques semble incongrue, d'autant plus que des problèmes juridiques entourent actuellement ceux utilisés.

Ces discussions complexes peuvent expliquer la réticence initiale de Nvidia à fournir des réponses sur l'utilisation des données. La réalité est que toutes ces technologies reposent les unes sur les autres. Ace dépend de Convai, qui s’appuie sur le travail d'OpenAI—une structure en couches qui rend difficile l'identification de l'origine des données aux niveaux inférieurs. L'affirmation de Nvidia selon laquelle il n'y a "pas de réponse simple" concernant l'utilisation des données est exacte, mais une explication plus honnête pourrait être qu'ils manquent d'une connaissance complète de l'ensemble du système. Bien que Nvidia soit peu susceptible de faire l'objet d'un examen judiciaire, une défaite juridique majeure pour OpenAI pourrait avoir des conséquences considérables.

Au fur et à mesure que nous décryptons ces détails complexes, je soulève le sujet de la régulation. Le gouvernement devrait-il intervenir pour établir des directives concernant la technologie IA ? Mukherjee reconnaît la nécessité d'une certaine régulation, mais souligne l'importance d'une approche nuancée. Il craint que des restrictions excessives ne freinent l'innovation, et reste convaincu que les avantages de l'IA l'emportent sur les inconvénients potentiels.

"Qu'est-ce que l'IA aujourd'hui ? Pensez-y comme une voiture," compare-t-il. "Les voitures peuvent être dangereuses; des accidents peuvent survenir. Pourtant, nous les conduisons tous les jours car les avantages globaux sont significatifs. Je vois l'IA sous cet angle. Nous aurons besoin de réglementations sur son utilisation, tout comme nous réglementons comment conduire un véhicule. Des conséquences légales s'appliqueront à ceux qui en abusent."

Le changement est inévitable, et ce changement apporte souvent de l'inconfort.

Malgré certaines comparaisons sombres, Mukherjee conserve un regard optimiste sur l'IA. Il croit sincèrement qu'elle apportera des avantages considérables à la société, à condition que les entreprises continuent de privilégier le bien-être humain. Il envisage un avenir où des outils tels que Nvidia Ace renforcent les talents des artistes plutôt que de les remplacer. Plutôt que de craindre un avenir dominé par les machines, il reconnaît la nécessité de s'adapter.

"Le changement va se produire, et il aura un impact sur les gens," reconnaît Mukherjee. "C'est semblable aux changements technologiques du passé. À chaque changement significatif, de nouvelles opportunités d'emploi émergent, tandis que d'anciens rôles peuvent décliner. Pensez à la transition des calèches tractées par des chevaux aux automobiles. Ceux qui étaient impliqués dans l'industrie équine ont dû s'adapter. L'IA générative ouvrira de nouvelles avenues pour la créativité et l'innovation—elle est prête à bénéficier à l'humanité dans son ensemble, mais nécessitera aussi des changements dans l'emploi traditionnel."

À la fin de notre entretien, Mukherjee a exprimé sa gratitude pour l'occasion de clarifier les malentendus entourant Convai. Il a noté qu'une grande partie de la couverture médiatique autour de Nvidia Ace a négligé les contributions de son entreprise. On perçoit une pointe de frustration dans son ton alors qu'il cherche une reconnaissance légitime. Je réfléchis à l'ironie de cette situation, comparant son expérience à celle des artistes voyant leur travail exploité par des outils d'IA.

"C'est une observation pertinente !" répond-il avec un rire, peut-être en acquérant une nouvelle perspective sur la question.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles