NVIDIA AI 팀, 무단으로 YouTube 및 Netflix 영상 수집했다 주장

업계에서 우려스러운 추세가 나타나고 있습니다. NVIDIA가 AI 교육 이니셔티브를 위해 대량의 저작권 콘텐츠를 수집했다는 주장이 제기되었습니다. 404 미디어의 사만다 콜은 월요일에 이 기술 대기업이 2.4조 달러의 가치로, 직원들에게 YouTube 및 Netflix와 같은 플랫폼에서 동영상을 다운로드하도록 지시했다고 보도했습니다. 이는 변동성이 큰 AI 분야에서 경쟁하는 기술 기업들 간의 '신속하게 움직이고 문제를 해결하라'는 넓은 정신을 반영합니다.

NVIDIA의 교육 노력은 Omniverse 3D 세계 생성기, 자율주행 차량 시스템 및 '디지털 인간' 기술 모델 생성에 중점을 두었다고 전해졌습니다. 한 대변인은 회사의 연구가 저작권 법을 준수한다고 주장하며, 지적 재산권(IP) 법은 특정 표현만 보호하고 사실, 아이디어, 데이터는 보호하지 않는다고 설명했습니다. 이들은 이러한 관행을 새로운 표현을 창출하기 위해 다양한 소스로부터 배우는 개인의 권리에 비유했습니다.

하지만 YouTube는 이에 동의하지 않습니다. 대변인 잭 말론은 4월 블룸버그 기사를 인용하며, CEO 닐 모한이 YouTube 비디오를 AI 교육에 사용하는 것은 플랫폼의 서비스 약관을 명백히 위반한다고 밝혔습니다. 이 발언은 OpenAI가 허가 없이 YouTube 콘텐츠로 Sora 텍스트-비디오 생성기를 훈련한 것과 관련된 이전 논란들을 뒤따랐습니다. 비슷한 맥락에서 Runway AI도 유사한 관행을 따랐다는 최근 보도도 있었습니다.

윤리적 및 법적 우려를 제기한 NVIDIA 직원들은 경영진이 이 이니셔티브가 회사의 최고 수준에서 승인되었다고 말했다고 전해졌습니다. 연구 부사장 민유 리우는 "이것은 경영진의 결정"이라며 "모든 데이터에 대한 승인을 받았다"고 확인했습니다. 다른 직원들은 이 관행을 "향후 해결할 개방된 법적 문제"라고 설명했습니다.

이 상황은 사용자 개인 정보 보호에서 경계를 허문 페이스북(메타)의 오래된 구호와 유사합니다. YouTube 및 Netflix의 콘텐츠 외에도 NVIDIA는 MovieNet, 내부 비디오 게임 라이브러리, GitHub 리포지토리(WebVid, 현재 중단됨) 및 10백만 개의 YouTube 비디오 ID를 포함하는 InternVid-10M과 같은 데이터 세트를 사용하도록 직원들에게 지시한 것으로 보입니다.

NVIDIA가 사용한 일부 콘텐츠는 학술적 또는 비상업적 용도로만 지정되었습니다. 예를 들어, 1억 3천만 개의 YouTube 비디오로 구성된 HD-VG-130M 라이브러리는 학술 연구에 제한된 사용 라이센스를 포함하고 있습니다. 그럼에도 불구하고 NVIDIA는 이러한 학술 전용 조건에 대한 우려를 무시하고, 데이터를 상업적 AI 목표를 위해 사용할 수 있다고 주장했습니다.

NVIDIA는 YouTube에 적발되지 않기 위해 다운로드 시 IP 주소가 회전되는 가상 머신(VM)을 사용한 것으로 보입니다. 한 직원이 타사 IP 주소 회전 도구를 사용할 것을 제안하자, 다른 직원은 "가상 머신 인스턴스를 재시작하면 새로운 공공 IP가 생성된다"며 적발 문제는 없다고 반박했습니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles