AI動画スタートアップRunway、無許可で数千本のYouTube動画を使用してトレーニングした疑惑

AI企業Runwayは、適切な許可なしに「数千」のYouTube動画や著作権で保護された映画を不正にコピーした疑いがあります。調査報道機関404 Mediaは、同社がディズニー、ネットフリックス、ピクサーなどの大手企業が所有するチャンネルからコンテンツを使用してGen-3モデルをトレーニングしていたことを示す内部スプレッドシートを入手しました。

匿名の元Runway社員によると、これらのスプレッドシートは、動画をデータベースに追加するために使用され、オープンソースのプロキシソフトウェアを使って検出を逃れながらダウンロードされていたとのことです。あるスプレッドシートには「宇宙飛行士」「妖精」「虹」などの単語が記載され、質の高いトレーニングビデオの入手可能性についての注釈が添えられています。たとえば、「スーパーヒーロー」というキーワードには「多数の映画クリップ」というメモがありました。他のメモには、Unreal Engineに焦点を当てたチャンネルや映画製作者のジョシュ・ニューマン、Call of Dutyファンページが「高い動き」のトレーニングビデオの優れたソースとして挙げられていました。

「このスプレッドシートに記載されたチャンネルは、モデル開発のための質の高い動画を発見する会社全体の取り組みを示しています」と元社員は述べました。「これにより、リストされたすべてのチャンネルから動画をダウンロードする巨大なウェブクローラーが作成され、Googleによる検出を逃れるためにプロキシを利用しました。」

スプレッドシートには、CBSニューヨーク、AMCシアター、ピクサー、ディズニープラス、さらにはモントレー湾水族館からのコンテンツを含む、約4,000の「推奨」YouTubeチャンネルが記載されていました。また、Runwayは海賊版サイトから集めた動画のリストも別に作成しており、「Non-YouTube Source」というタイトルのスプレッドシートにはスタジオジブリの映画や様々なアニメ、映画の海賊版プラットフォームへのリンクが示されていました。

404 Mediaは、スプレッドシートに掲載された人気YouTuberの名前を入力すると、驚くほど似た結果が得られることを発見しました。対照的に、異なるデータでトレーニングされたRunwayの古いGen-2モデルを使うと、スーツ姿の男性の一般的な画像など、無関係な結果が表示されました。特に、404 MediaがYouTuberの類似性について問い合わせた後、AIツールはこれらの類似画像を生成しなくなりました。

「この情報を共有することで、これらの企業や彼らの「クールな」動画を生成する手法の実態を理解してもらえることを願っています」と元社員は述べました。

コメントを求めると、YouTubeの代表者はCEOニール・モハンとの4月のインタビューを引き合いに出し、「私たちの動画でのトレーニングはYouTubeの利用規約に対する明確な違反である」と述べました。「以前のコメントは依然として有効です」とも付け加えました。Runwayは、出版の締め切りまでにコメントには応じませんでした。

AI業界が進化を続ける中、一部の企業は市場の支配を確立しようと努めているかもしれませんが、消費者や法制度が彼らの慣行の影響を完全に理解する前に。在庫に基づいた許可を得たトレーニングは、一部の企業(OpenAIのような)によって採用されている方法ですが、著作権で保護された素材をスクレイピングすることは、利益と技術的優位性を争う中で、はるかに物議を醸す戦略となっています。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles