NVIDIA的人工智慧團隊據報導在未經同意的情況下擷取了YouTube和Netflix的視頻內容。

在業界引人關注的趨勢中,NVIDIA 据信大量收集版權內容以支持其人工智慧訓練計畫。404 Media 的 Samantha Cole 於週一報導,這家市值 2.4 兆美元的科技巨頭指示員工下載 YouTube 和 Netflix 等平台上的影片,以推動其商業 AI 項目。這一行為反映了科技公司在不穩定的 AI 領域中爭取主導地位的「快速行動,打破常規」的心態。

據稱,這些訓練工作專注於為 NVIDIA 的 Omniverse 3D 世界生成器、自動駕駛系統和「數位人類」技術創建模型。一位發言人表示,該公司的研究遵循版權法,主張智慧財產權(IP)法僅保護特定的表達方式,而非事實、想法或數據。他們將這一做法比作個人從不同來源學習以創造新表達的權利。

然而,YouTube 對此表示異議。發言人 Jack Malon 引用了四月的彭博社報導,其中 CEO Neal Mohan 指出,使用 YouTube 影片進行 AI 訓練將明顯違反該平台的服務條款。這一聲明緊隨 OpenAI 未經授權使用 YouTube 內容訓練其 Sora 文字轉影片生成器的爭議之後。同樣,有報導指出 Runway AI 也採取了類似做法。

據報導,表達道德和法律關注的 NVIDIA 員工被管理層告知,這一計劃已獲得公司最高層的批准。研究副總裁劉明宇強調,「這是一項高層決策」,並確認他們對所有數據都有「總體批准」。公司內部其他人士則將這一做法形容為「待後續處理的公開法律問題」。

這種情況讓人聯想到 Facebook(Meta)的老口號,該公司亦因突破邊界而蓬勃發展,特別是在用戶隱私方面。除了來自 YouTube 和 Netflix 的內容外,NVIDIA 還據稱指示其員工對 MovieNet、內部遊戲庫及 GitHub 的數據集進行訓練,如 WebVid(目前已因停止函而移除)和 InternVid-10M,後者包含一千萬個 YouTube 影片 ID。

NVIDIA 報導中提到的某些內容原本僅供學術或非商業用途。例如,包含一億三千萬個 YouTube 影片的 HD-VG-130M 資料庫擁有一項使用許可,僅限於學術研究。儘管如此,NVIDIA 據稱仍忽視了這些學術專用條件的擔憂,聲稱這些數據對其商業 AI 目標來說是公平競爭的資源。

為了避開 YouTube 的檢測,NVIDIA 據說使用旋轉 IP 地址的虛擬機(VM)進行下載。當一名員工建議使用第三方 IP 地址旋轉工具時,另一名員工反駁說,「重啟虛擬機實例可以獲得新的公共 IP」,這表明檢測並不是問題。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles