NVIDIA AI团队被指未经同意抓取YouTube和Netflix视频

在行业内出现了令人担忧的趋势:NVIDIA据称大量收集版权内容用于其人工智能训练项目。404 Media的萨曼莎·科尔在周一报道,这家市值2.4万亿美元的科技巨头指示员工从YouTube和Netflix等平台下载视频,以支持其商业AI项目。这一举动反映了科技公司在竞争激烈的AI领域中普遍存在的“快速行动,打破常规”的心态。

据悉,NVIDIA的训练工作重点在于为Omniverse 3D世界生成器、自动驾驶系统以及“数字人类”技术创造模型。一位发言人表示,公司在研究中遵循版权法,认为知识产权法仅保护特定表达方式,而不保护事实、思想或数据。他们将这一做法比作个人从各种资源中学习以创造新表达的权利。

然而,YouTube对此持不同意见。发言人杰克·马龙提到了4月的一篇彭博社文章,文中首席执行官尼尔·莫汉表示,使用YouTube视频进行AI训练显然违反了平台的服务条款。此声明与OpenAI因未获授权而使用YouTube内容训练其Sora文本到视频生成器的争议相呼应。最近的报道还指出,Runway AI也进行了类似的行为。

据称,NVIDIA的员工在提出道德和法律顾虑时,被管理层告知该项目已获得公司高层批准。研究副总裁刘明宇强调:“这是高管的决定,”并确认他们对所有数据拥有“总批准”。公司内部的其他人则将这一做法视为一个“开放的法律问题”,待后续处理。

这一情况让人联想到Facebook(Meta)曾经的口号,该公司同样在突破边界方面颇有建树,尤其是在用户隐私方面。除了YouTube和Netflix的内容外,NVIDIA还 allegedly指示员工使用MovieNet、内部视频游戏库,以及GitHub的WebVid(已因停止令被移除)和InternVid-10M等数据集进行训练,后者包含1000万个YouTube视频ID。

NVIDIA据称利用的一些内容仅限于学术或非商业用途。例如,HD-VG-130M库包含1.3亿个YouTube视频,使用许可限制其仅用于学术研究。尽管如此,NVIDIA reportedly忽视了这些学术限制条款,声称这些数据可以自由用于其商业AI目标。

为了避免被YouTube发现,NVIDIA allegedly使用了带有随机IP地址的虚拟机(VM)进行下载。当一名员工建议使用第三方IP地址旋转工具时,另一名员工反驳道:“重启虚拟机实例会获得一个新的公共IP,”表明被检测并非问题。

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles