NVIDIA AI团队被指未经同意抓取YouTube和Netflix视频

Home AI News CN NVIDIA AI团队被指未经同意抓取YouTube和Netflix视频

在行业内出现了令人担忧的趋势：NVIDIA据称大量收集版权内容用于其人工智能训练项目。404 Media的萨曼莎·科尔在周一报道，这家市值2.4万亿美元的科技巨头指示员工从YouTube和Netflix等平台下载视频，以支持其商业AI项目。这一举动反映了科技公司在竞争激烈的AI领域中普遍存在的“快速行动，打破常规”的心态。

据悉，NVIDIA的训练工作重点在于为Omniverse 3D世界生成器、自动驾驶系统以及“数字人类”技术创造模型。一位发言人表示，公司在研究中遵循版权法，认为知识产权法仅保护特定表达方式，而不保护事实、思想或数据。他们将这一做法比作个人从各种资源中学习以创造新表达的权利。

然而，YouTube对此持不同意见。发言人杰克·马龙提到了4月的一篇彭博社文章，文中首席执行官尼尔·莫汉表示，使用YouTube视频进行AI训练显然违反了平台的服务条款。此声明与OpenAI因未获授权而使用YouTube内容训练其Sora文本到视频生成器的争议相呼应。最近的报道还指出，Runway AI也进行了类似的行为。

据称，NVIDIA的员工在提出道德和法律顾虑时，被管理层告知该项目已获得公司高层批准。研究副总裁刘明宇强调：“这是高管的决定，”并确认他们对所有数据拥有“总批准”。公司内部的其他人则将这一做法视为一个“开放的法律问题”，待后续处理。

这一情况让人联想到Facebook（Meta）曾经的口号，该公司同样在突破边界方面颇有建树，尤其是在用户隐私方面。除了YouTube和Netflix的内容外，NVIDIA还 allegedly指示员工使用MovieNet、内部视频游戏库，以及GitHub的WebVid（已因停止令被移除）和InternVid-10M等数据集进行训练，后者包含1000万个YouTube视频ID。

NVIDIA据称利用的一些内容仅限于学术或非商业用途。例如，HD-VG-130M库包含1.3亿个YouTube视频，使用许可限制其仅用于学术研究。尽管如此，NVIDIA reportedly忽视了这些学术限制条款，声称这些数据可以自由用于其商业AI目标。

为了避免被YouTube发现，NVIDIA allegedly使用了带有随机IP地址的虚拟机（VM）进行下载。当一名员工建议使用第三方IP地址旋转工具时，另一名员工反驳道：“重启虚拟机实例会获得一个新的公共IP，”表明被检测并非问题。

OpenAI将在ChatGPT回应中融合《连线》、《时尚》和《纽约客》的内容

OpenAI 探索文本水印技术，以识别学生作弊行为的 ChatGPT 解决方案