AI 影片創業公司 Runway 據稱在未經授權的情況下,以數千部 YouTube 影片進行訓練。

據報導,人工智慧公司 Runway 涉嫌未經授權擅自擷取數千支 YouTube 影片和盜版電影。調查媒體 404 Media 獲得的內部電子表格顯示,這家 AI 影片生成初創公司利用迪士尼、Netflix 和 Pixar 等大型機構擁有的頻道內容訓練其 Gen-3 模型。

一名匿名前員工透露,這些電子表格用於識別公司資料庫中的影片,然後利用開源代理軟體進行無法檢測的下載。一份電子表格包含簡單關鍵字,如「宇航員」、「仙女」和「彩虹」,並附有關於高質量訓練影片可用性的註釋。例如,關鍵字「超級英雄」旁註「大量的影像片段」。其他註解指出,專注於 Unreal Engine 的頻道、電影製作人 Josh Neuman,以及一個《決勝時刻》粉絲頁被視為「高運動」訓練影片的優秀來源。

這名前員工表示:「這份電子表格中的頻道代表了公司全體的努力,以發現高質量的影片用於模型開發。」他補充道:「這導致創建了一個大型網路爬蟲,從所有列出頻道中下載影片,並使用代理來避開 Google 的檢測。」

這份電子表格列出了近 4,000 個 YouTube 頻道,標記為「推薦」,其中包含 CBS New York、AMC Theaters、Pixar、Disney Plus 甚至蒙特雷灣水族館的內容。據報導,Runway 還另外收集了一份來自盜版網站的影片清單,其中一份名為「非 YouTube 來源」的電子表格列出 Studio Ghibli 影片及各種動漫和電影盜版平台的未經授權檔案鏈接。

為進一步驗證不當數據使用的指控,404 Media 發現,如果輸入清單中流行的 YouTuber 名稱,會產生非常相似的結果。然而,使用相同名稱與 Runway 的舊版 Gen-2 模型——訓練於不同資料——則會產生無關的結果,例如穿西裝的男人的普通圖片。值得注意的是,在 404 Media 詢問產出影片與 YouTuber 之間的相似性後,該 AI 工具完全停止生成這些類似的形象。

這名前員工表示:「我希望分享這些資訊能幫助人們理解這些公司及其創造『酷』影片的方式的廣泛程度。」

當被要求評論時,YouTube 一名代表提到 CEO Neal Mohan 在四月的採訪中,將在其影片上進行訓練描述為「明顯違反」YouTube 條款。他表示:「我們之前的評論仍然有效。」在出版的截止日期之前,Runway 未回應對評論的請求。

隨著 AI 環境的不斷演變,一些公司可能會急於在消費者和法律系統完全理解其做法的影響之前,樹立市場主導地位。雖然透過授權協議進行授權訓練是一種方法(如 OpenAI 等公司所採用),但為了獲利和技術優勢而擅自擷取受版權保護的資料則是一種更具爭議性,甚至可能是違法的策略。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles