生成AIの「原罪」とも呼ばれる問題は、OpenAIやMetaといった企業の主要なモデルが、元の創作者の同意や認識なしにインターネットから収集されたデータで訓練されていることです。AI企業はこの実践が法的に許可されていると主張しています。OpenAIは最近のブログ投稿で、「公開されているインターネットの資料を使用してAIモデルを訓練することはフェアユースであり、長年の先例に基づいています。私たちは、これは創作者にとって公正であり、イノベーターに必要であり、米国の競争力にとって重要だと考えています」と述べています。
このデータ収集は、生成AIの登場以前から存在し、多くの研究データベースや商業製品、またGoogleのような人気の検索エンジンでも利用されてきました。これらは創作者が自身のプロジェクトへのトラフィックを獲得するために依存しています。しかし、この実践に対する反対の声は高まっており、多くの著者やアーティストが自身の作品が明示的な同意なしに訓練に使用されたとして、いくつかのAI企業を訴えています。特に、MidjourneyとOpenAIは厳しい監視にさらされています。
新たに設立された非営利団体「Fairly Trained」は、データの創作者の権利を守るために活動しており、AI訓練に使用される前に明示的な同意を得るべきだと主張しています。元Stability AIの社員であるエド・ニュートン・レックス氏が共同設立したこの団体は、AI企業が創作者の権利を尊重することを目指しています。「我々は、多くの消費者や企業が、創作者の同意に基づいてデータを使って訓練する生成AI企業と協力したいと考えていると信じています」と、団体のウェブサイトでは述べています。
ニュートン・レックス氏は、創作者を尊重する生成AIの未来への道を強調し、訓練データに関するライセンスモデルの必要性を唱えています。「生成AI企業でこのアプローチを優先するところがあれば、ぜひ認定を受けることを検討してほしい」と、彼はソーシャルメディアで語っています。
AI支持者が「公に利用可能なデータでの訓練は人間の学習方法と似ている」と常に主張することについて、ニュートン・レックス氏は以下のように反論しました。「この主張には二つの問題があります。第一に、AIはスケールします。単一のAIが膨大な出力を生成でき、オリジナルコンテンツに対する需要を代替できるため、人間にはできないことです。第二に、人間学習は確立された社会契約の中で行われます。創作者は自分の作品が他者に影響を与える可能性を常に理解しており、AIシステムがその作品を利用して競合コンテンツを生成することは予想していませんでした。」
ニュートン・レックス氏は、すでに公に利用可能なデータで訓練しているAI企業に対し、創作者からの許可を得るライセンスモデルへの移行を提案しています。「生成AIの進化はまだ始まったばかりであり、人間の創作者とAI企業の双方にとって持続可能なエコシステムを構築する時間はあります」と彼は述べました。
Fairly Trainedは、訓練データのために同意を得ている企業とそうでない企業を区別するための「ライセンスモデル(L)認証」を導入しました。認証プロセスはオンライン提出から始まり、さらに詳しいレビューが行われ、年収に応じた料金($150から$6,000)が設定されています。
「私たちは費用をカバーするために料金を設定していますが、生成AI企業にとって過度に負担になるような金額ではありません」とニュートン・レックス氏は説明しました。いくつかの企業、例えばBeatoven.AIやSoundfulはすでにこの認証を受けていますが、具体的な手数料額は明示されていません。
AdobeやShutterstockのように、クリエイターの作品を利用してAIモデルを訓練している企業について問われた際には、「認証していない特定のモデルについてはコメントしたくありません。彼らのモデルが我々の認証基準を満たすと信じるのであれば、応募を推奨します」と述べました。
Fairly Trainedのアドバイザーには、元Siriの最高技術責任者トム・グルーバー氏や、アメリカ出版業者協会の社長マリア・パランテ氏が含まれています。また、独立音楽出版者協会やユニバーサルミュージックグループなど、著作権侵害を巡る訴訟に関与している著名な団体からの支持も得ています。
Fairly Trainedが現在進行中の訴訟に関与しているか問われた際、ニュートン・レックス氏は「いいえ、私は一切の訴訟には関与していません」と明言しました。また、認証料以外の外部資金源は現在存在しないことも確認しました。