今月初め、私は驚くべき技術革新を目の当たりにしました。CES前のプレスブリーフィングで、NvidiaはAIキャラクターを完全に音声化できる「Aceマイクロサービス」というAIスイートを示すデモを発表しました。デモに登場したプレゼンターがマイクを通じてゲーム内のNPCと対話し、リアルタイムで生き生きとした応答を受け取る様子に、私は驚かされました。まるでSFの世界にいるかのようでしたが、一つの疑問が残りました:これはどうやって実現されたのでしょうか?
Nvidiaの回答は曖昧で、「簡単な答えはない」と述べました。この不明瞭さはSNS上での激しい憶測を引き起こし、多くのユーザーがAceがNvidiaの所有しないコンテンツで訓練されたのではないかという懸念を示しました。Nvidiaは後に、合法的に取得したデータのみを使用していると説明しましたが、不安は残りました。ゲーマーたちは、この技術にまつわる倫理的および芸術的な問題に悩まされていました。
この動向を観察していたのは、ソフトウェアエンジニアであり、この論争の中心にいるAI技術の創始者プルネンドゥ・ムカルジーです。彼は、CES 2024でNvidiaのKairosデモを支える生成AI会社Convaiの創立者であるのです。ムカルジーは、反響の中で黙っているのではなく、誤解を直接訂正する機会を活かしました。
長いインタビューの中で、ムカルジーは自身の技術に関するさまざまな倫理的懸念に対処しました。彼は、職業の喪失への恐れや、AIが芸術における人間の感触を侵害する懸念といったトピックについて議論しました。これらの懸念に反して、ムカルジーは、アーティストがAIを共同で活用して創造的な表現を高める未来を思い描いています。しかし、データ使用についての彼の見解は追加の疑問を引き起こします。
ムカルジーは、幼少期から人間の心に惹かれ、高校時代にはAIに対する探索を始めました。最初は硬直した規則ベースのシステムに落胆したものの、2015年にインドのラボで深層学習に没頭し、その興味が再燃しました。大学院での研究を経てNvidiaで経験を積んだ後、彼は2022年4月にConvaiを立ち上げ、最初の10ヶ月間は独自に資金を調達しました。
生涯のゲーマーとして、ムカルジーは地元のインターネットカフェでCounter-Strikeのような競技ゲームをプレイし始め、AIがゲームプレイをどのように向上させるかを初めて想像しました。基本的なゲームボットへのユーモラスな批判から始まったアイデアは、画期的な革新へと成長しました。Convaiの技術は、プレイヤーのプロンプトに動的に反応できる完全に音声化されたNPCを生成するために複数のAIプロセスを利用し、より没入感のあるゲーム体験を目指しています。
「Baldur's Gate 3やThe Witcherのようなタイトルを考えてみてください」とムカルジーは言います。「これらのゲームには豊かなストーリーと深いキャラクターアークがあります。しかし、プレイヤーはNPCとの限られた対話オプションのために、これらの物語を十分に探求できないことが多いのです。今日の技術を使えば、NPCに自らの命を吹き込み、プレイヤーとキャラクターになりきって対話し、物語の深入りを提供できるようになります。」
この感情は、AIに関する相互連関した懸念についての広範な議論を引き起こします。Baldur's Gate 3が巧妙に作られた対話なしでも響くのかについて議論する際、機械生成コンテンツと芸術的完全性の複雑な関係に踏み込みます。ムカルジーは懐疑心に正面から取り組み、AIはアーティストの代わりではなく、彼らの意見を必要とするツールであると強調します。
「ナラティブデザイナーの需要は減ることはないと思います」と彼は述べ、AIがより多くの作家の役割を生み出す可能性を示します。「作家はバックストーリーやナラティブを作成するとともに、強固なテストセットを開発する必要があります。生成AIベースのNPCを数百万ドルのゲームに統合できる自信を持つためには、数百または数千のインタラクションが必要で、そのほとんどは元のナラティブ作家が制作するのが理想的です。我々のプラットフォームでは、ユーザーに詳細なバックストーリーや文書を提供してもらう必要がありますので、最終的には通常行うよりもはるかに多くのライティングが求められることになります。」
この視点は、私たちの対話の中で繰り返しテーマとなります。ムカルジーは生成AIツールが効果的に訓練されるためには、より多くのアーティストの参与が必要になると繰り返し主張します。彼は、改善されたAIがゲームの質を向上させ、販売の増加や音声俳優の給与の向上につながると予測します。彼の見通しは楽観的であり、特に現在のビデオゲーム業界のレイオフの波を考えると一層です。
ムカルジーは、レイオフの現実を認めつつ、生成AIの台頭を自然な技術進化の一部と位置づけています。彼は、クリエイターたちが脅威と捉えるのではなく、AIとの協力的な相乗効果を受け入れる必要があると信じています。
「あなたは創造者であり、マスターであり、それを制御する人です」と彼は主張します。
話は続き、私は情熱を持って自らの技術を創造するアーティストについて尋ねます。彼らがAIエンジニアに転身することは本当にそんなに簡単なのでしょうか?ムカルジーは、芸術と技術の交差点を認識することの重要性を指摘します。
「AIはAdobe PhotoshopやUnreal Engineのようなツールです」と彼は言います。「確かに、これらの技術が登場する前にもゲームは存在しており、作者は手作業でそれらを構築しました。でもUnreal Engineを使って素晴らしいアートを制作できますか?絶対にできます。AI生成コンテンツを使う場合でも、3Dビデオ編集の緻密なディテールは現存します。製作の本質は変わっておらず、より強力なツールによって強化されるのです。あなたはもちろん、依然として創造者で、自らのビジョンを shapingする人間です。」
ムカルジーはAIをアーティストにとっての資産として捉え、代替物と見なしていないことが明らかです。彼はAIが人間の創造力に依存していることに関するいくつかの重要な点を繰り返しつつ、広く存在する懸念に対処します。しかし、データ使用の問題は依然として物議を醸します。批評家たちは、自身の作品で訓練されたAIモデルが知的財産を盗んでいると主張する一方で、一部の開発者たちは、有効なモデル訓練には膨大なデータ、特に著作権のあるコンテンツが必要だと主張します。ムカルジーは、AI訓練データセットにおいて自らの貢献が反映されたクリエイターには補償されるべきだと提案します。
「重要なデータを提供した個人が公正に補償されるシステムが必要です」と彼は言います。「ニューヨークタイムズでもRedditでも、適切なライセンスが不可欠です。これは複雑な問題ですが、特に商業用途において、この方向に進む必要があると私は信じています。」
Convaiのデータ使用について問われた際、ムカルジーは、同社が権利を持つデータのみを使用していることを強調します。「技術が新たな分野を切り開いているため、特定のデータをランダムに集めることは不可能です」と説明します。しかし、彼はこの議論における逆説に素早く触れます。
「私たちはOpenAIやライセンスされたオープンソースモデルの基礎モデルを使用しています」と彼は明らかにします。「これらは倫理的に取得され、商業的にライセンスされる必要があります。我々はこのプロセスを非常に慎重に行っています。実際、我々のシステムでは、より少なくなるのではなく、むしろ多くの音声俳優が必要です!」
OpenAIについて言及すると、一部の懸念が浮上します。特に現在、The New York Timesからの訴訟を受けた法的な課題があるためです。OpenAIは、著作権物を利用せずに高度なAIモデルを訓練するのが難しいことを認めています。ConvaiのモデルはOpenAIの技術に基づくため、ムカルジーにどのようにして著作権を侵害しない保証があるのか尋ねます。
ムカルジーは微妙な区別をします。ConvaiはOpenAIのデータを直接使用しているのではなく、そこから開発されたモデルを使用しているのです。このニュアンスは法的な抜け穴を示唆しているかもしれません。ムカルジーは、Convaiがデータを直接使わない限り、著作権に関して遵守していると信じています。しかし、モデルを使用することと、それに含まれる可能性のある著作権データを使用することの違いを明らかにしようとすると、彼の説明は不明瞭になります。
「どのモデルにどのデータが含まれているかはあいまいです」と彼は認めます。「私たちはその明確さを持っていません。たとえば、OpenAIが5つのモデルを提供し、Nvidiaが4つ、Metaが3つであれば、我々は要求を最も満たすものを使用するだけで、その正確なデータの出所はわかりません。」
ムカルジーの理由付けは、Convaiが他のモデルのデータ管理に責任を負わないことを示唆しています。彼の焦点は、Convaiのデータ取り扱いが倫理的であることを保証することで、基盤となるモデルも遵守していることを期待しています。しかし、Convaiが最も倫理的なモデルを使用するという前の主張は、現在使用されているモデルの法的問題を考えると矛盾するようです。
これらの複雑な議論は、Nvidiaがデータ使用に関して初めに回答を控えた理由を明らかにするかもしれません。実際、これらの技術は相互に依存しており、AceはConvaiに依存し、ConvaiはOpenAIの成果に基づいており、下層でのデータ起源を明確に特定するのは困難です。Nvidiaがデータ使用に「簡単な答えはない」と主張したのは正しいですが、より率直な説明は、彼らが全体のシステムについて十分な知識を持っていないことかもしれません。Nvidiaが法廷での審査を受ける可能性は低いですが、OpenAIが重大な法的敗北を喫すれば、波及的な影響があるでしょう。
これらの複雑な詳細を解きほぐす中で、私は規制についての話題を持ち出します。政府はAI技術に関するガイドラインを定めるために介入すべきでしょうか?ムカルジーは何らかの規制の必要性を認めつつも、適切なアプローチの重要性を強調します。過度な制約が革新を阻害することを心配しており、AIの利点が潜在的な欠点を上回ると確信しています。
「今日のAIとは何でしょうか?自動車のように考えてみてください」と彼は比較します。「自動車は危険であり、事故も起こり得ます。でも私たちは毎日運転します。なぜなら、その全体的な利益が大きいからです。私もAIを同じ光景で見ています。使用には規制が必要ですが、車の運転を規制するように、その使い方が重要です。誤用した場合は法的な結果が伴うでしょう。」
変化は避けられず、変化はしばしば不快感を伴います。
厳しい比較の中でも、ムカルジーはAIに対して希望に満ちた見解を持っています。彼は、企業が人間の福祉を優先し続ける限り、社会に大きな利益をもたらすと心から信じています。彼は、Nvidia Aceのようなツールがアーティストの才能を強化する未来を思い描いています。機械によって支配される未来を恐れるのではなく、適応の必要性を認識しています。
「変化は起こります、そして人々に影響を与えます」とムカルジーは認めます。「これは過去の技術の変革を思い起こさせます。大きな変化のたびに、新しい仕事の機会が生まれ、古い役割は衰退することがあるのです。馬車から自動車への移行を考えてみてください。馬産業に関わる人々はピボットする必要がありました。生成AIは創造性と革新の新しい道を切り開くことになるでしょう—人類全体に利益をもたらす可能性を秘めていますが、従来の雇用においても変化を伴うでしょう。」
インタビューの最後に、ムカルジーはConvaiに関する誤解を解消する機会に感謝の意を示しました。Nvidia Aceに関連するメディアの報道の多くが、彼の会社の貢献を見落としていたと指摘しました。彼のトーンには、自らの正当な評価を求めるほのかな不満が感じられました。私はこの状況の皮肉に思いを馳せ、彼の経験をAIツールに作品を利用されるアーティストたちのそれに例えます。
「それは興味深い観察です!」と彼は笑いながら応じ、問題について新たな視点を得たかのようです。