OpenAI、AIモデル「Sora」の訓練に無断でYouTube動画をスクレイピングしたと非難される：物議を醸す論争が勃発

Home AIニュース OpenAI、AIモデル「Sora」の訓練に無断でYouTube動画をスクレイピングしたと非難される：物議を醸す論争が勃発

最近、人工知能業界のリーディングカンパニーであるOpenAIがデータ収集の遵守に関する論争に巻き込まれています。『ウォール・ストリート・ジャーナル』や『ニューヨーク・タイムズ』の報道によると、OpenAIは自社のテキストからビデオへ変換するモデル「Sora」のトレーニングにおいて、YouTubeのコンテンツを無許可で使用したという疑惑に直面しています。

この主張は、GoogleやYouTubeから強い反発を呼び起こしました。Googleのスポークスマンであるマット・ブライアント氏は、YouTubeコンテンツの無許可のスクレイピングやダウンロードは厳禁であるとし、Googleのrobots.txtファイルおよび利用規約にも明記されていると述べました。また、YouTubeのCEOであるニール・モハン氏もブルームバーグのインタビューで、OpenAIの行動はYouTubeの利用規約に違反している可能性が高いと懸念を示しました。OpenAIが実際にYouTube動画を使用したという直接的な証拠はないものの、CEOのコメントは警鐘を鳴らし、OpenAIのデータ収集の透明性と遵守に対する疑問を浮き彫りにしました。

OpenAIのCTOミラ・ムラティ氏は、Soraのトレーニングデータの出所についてあいまいな回答を示し、同社のデータプラクティスに対する公衆の懸念をさらに深めています。大規模言語モデルのトレーニングには膨大なデータが必要ですが、データ保護意識の高まりや著作権規制の厳格化により、適切なトレーニングデータを入手することがますます困難になっています。一部のAI企業は倫理に反する手段に頼らざるを得ないというプレッシャーを感じ、データセキュリティやプライバシーに対する重大な懸念が生じています。

OpenAIにとって、合法的にデータを収集しながらも高品質で豊富なデータを確保することは、重要な課題となります。この事件は、技術革新と利益の追求において、倫理基準と法的限界を見落としてはならないことを、テクノロジー業界に強く警告しています。

現在、OpenAIのYouTube動画の不適切使用に関する調査が進行中です。規制当局が迅速に状況を明確にし、データセキュリティと著作権の保護を確保することが求められます。また、OpenAIにはこの問題を真剣に受け止め、データ収集と使用におけるコンプライアンス管理を強化し、AI産業の持続可能な発展に貢献することを期待します。

急速に進化する現代において、人工知能という先端技術は私たちの生活や社会構造に深く影響を与えています。技術が進化し、適用範囲が広がる中、データセキュリティとプライバシー保護に対する警戒を怠らないことが不可欠です。コンプライアンスと倫理を確立することで、AIは人類の真の利益と進展をもたらすことができるのです。

カナダ、AI産業競争力向上のために24億ドルを投資

百度文音の新機能紹介：手軽に自分だけのAI音声アシスタントをカスタマイズしよう