NVIDIA, AI 훈련에 있어 저작권 콘텐츠로 법적 도전 직면
기술 미디어 404Media가 공개한 최근 문서에 따르면, NVIDIA는 인공지능(AI) 시스템 훈련을 위해 상당량의 저작권 콘텐츠를 수집한 것으로 나타났습니다. 이 문서에는 내부 이메일, Slack 대화 및 관련 자료가 포함되어 있으며, NVIDIA가 AI 훈련 데이터 세트를 강화하기 위해 YouTube와 같은 다양한 비디오 플랫폼에서 데이터를 확보했다는 내용을 보여줍니다.
프로젝트에 참여한 직원들은 YouTube 비디오에서 데이터를 수집하는 것이 연구 목적으로 법적 위험을 초래할 수 있다는 우려를 표명했습니다. 그러나 한 프로젝트 관리자는 이 데이터 수집 방식이 회사 고위 경영진의 승인을 받았으며, "저작권법의 취지와 요건을 완전히 준수하고 있다"고 주장했습니다.
한 NVIDIA 직원에 따르면, 회사는 Omniverse 3D 생성기, 자율주행 시스템 및 디지털 휴먼 제품 훈련을 위해 YouTube와 Netflix와 같은 플랫폼에서 비디오를 수집할 것을 팀에 지시하고 있습니다. "Cosmos"라는 내부 명칭으로 알려진 이 프로젝트는 YouTube의 콘텐츠 탐지 메커니즘을 우회하기 위해 회전하는 IP 주소를 사용하는 가상 머신을 활용하여 차단을 피하고 있습니다.
이 직원은 "우리는 AWS 플랫폼을 사용하고 있으며, 인스턴스를 재시작하면 새로운 공개 IP가 할당되므로 현재로서는 문제가 되지 않습니다."라고 언급했습니다.
AI 기술이 발전함에 따라, 저작권 콘텐츠를 법적이고 윤리적으로 사용하는 문제는 기술 산업에 중요한 관심사로 자리 잡고 있습니다.