NVIDIA因AI训练中的版权内容面临法律挑战
最近,科技媒体404Media披露的文件显示,NVIDIA在训练其人工智能(AI)系统时积累了大量受版权保护的内容。这些文件包括内部电子邮件、Slack对话及相关材料,表明NVIDIA从多个视频平台(如YouTube)收集数据,以增强其AI训练数据集。
在这些对话中,参与项目的员工表达了对使用YouTube视频编译数据集的法律风险的担忧。然而,项目经理向他们保证,这种数据收集方式已获得公司高层的批准,并坚称这一做法“完全符合版权法的字面和精神”。
据某NVIDIA员工透露,公司已指示团队从YouTube和Netflix等平台收集视频,以用于训练其Omniverse 3D生成器、自动驾驶系统和数字人类产品。报道指出,这一项目在内部被称为“Cosmos”,使用旋转IP地址的虚拟机器以绕过YouTube的内容检测机制,避免被封禁。
该员工表示:“我们正在使用AWS平台,重启实例会分配新的公共IP,因此目前这不是问题。”
随着AI技术的进步,如何合法和伦理地使用受版权保护的内容进行训练已成为科技行业面临的重要挑战。这一问题的解决将直接关系到未来AI发展及其应用的可持续性。