AI 비디오 스타트업 Runway, 수천 개의 유튜브 비디오를 무단으로 학습한 혐의

AI 기업 Runway는 적절한 승인 없이 "수천 개"의 YouTube 동영상과 저작권이 있는 영화들을 불법으로 스크래핑한 혐의가 제기되었습니다. 탐사 매체 404 Media는 이 AI 동영상 생성 스타트업이 Disney, Netflix, Pixar와 같은 대형 기업 소속 채널의 콘텐츠를 사용하여 Gen-3 모델을 훈련시켰다는 내부 스프레드시트를 확보했습니다.

익명의 전직 Runway 직원은 이러한 스프레드시트가 회사 데이터베이스용 동영상을 식별하는 데 사용되었으며, 이후 오픈소스 프록시 소프트웨어를 이용해 몰래 다운로드되었다고 밝혔습니다. 한 스프레드시트에는 "우주비행사", "요정", "무지개"와 같은 간단한 키워드와 고품질 훈련 동영상의 가용성에 대한 주석이 포함되어 있었습니다. 예를 들어, "슈퍼히어로" 키워드에는 "많은 영화 클립"이라는 언급이 있었습니다. 다른 주석에서는 Unreal Engine, 영화 제작자 Josh Neuman, 그리고 Call of Duty 팬 페이지를 "높은 움직임" 훈련 동영상의 우수한 소스로 평가했습니다.

"그 스프레드시트에 있는 채널들은 모델 개발을 위한 우수한 동영상을 찾기 위한 회사 차원의 노력의 일환이었습니다,"라고 전직 직원은 전했습니다. "이로 인해 모든 목록에 있는 채널에서 동영상을 다운로드하는 대규모 웹 크롤러가 생성되어, Google의 탐지를 피하기 위해 프록시를 사용했습니다."

스프레드시트에는 CBS New York, AMC Theaters, Pixar, Disney Plus, 그리고 몬터레이 수족관 등의 콘텐츠가 포함된 "추천"으로 표시된 거의 4,000개의 YouTube 채널이 포함되어 있었습니다. Runway는 또한 스튜디오 지브리 영화와 다양한 애니메이션 및 영화 해적 플랫폼의 무단 아카이브 링크를 제시하는 "Non-YouTube Source"라는 제목의 스프레드시트를 통해 해적 사이트에서 비디오를 수집한 것으로 전해졌습니다.

404 Media는 스프레드시트에 나열된 인기 YouTuber의 이름을 입력했을 때 유사한 결과가 나타났다는 사실을 발견함으로써 무단 데이터 사용 주장을 추가로 입증했습니다. 반면, Runway의 이전 Gen-2 모델로 같은 이름을 사용했을 때는 정장 입은 남성의 일반적인 이미지와 같이 관련 없는 결과가 나타났습니다. 특히, 404 Media가 결과에 나타난 YouTuber의 유사성에 대해 문의한 후, AI 도구는 이러한 유사한 이미지를 생성하는 것을 전혀 중단했습니다.

"이 정보를 공유함으로써 사람들이 이러한 기업들과 그들의 '멋진' 동영상을 생성하는 방법의 범위를 이해하는 데 도움이 되기를 바랍니다,"라고 전직 직원은 말했습니다.

댓글 요청에 대한 YouTube의 대표는 CEO Neal Mohan과의 4월 인터뷰를 언급하며, 그들의 동영상 훈련이 YouTube의 규정을 "명백히 위반하는 행위"라고 설명했습니다. "이전에 우리가 한 설명은 여전히 유효합니다,"라고 그는 전했습니다. Runway는 보도의 마감일까지 논평 요청에 응답하지 않았습니다.

AI 환경이 계속 발전하는 가운데 일부 기업들은 소비자와 법률 시스템이 그들의 관행의 의미를 완전히 이해하기 전에 시장 지배력을 확립하려고 노력하고 있을 수 있습니다. OpenAI와 같은 기업들이 허가를 통해 라이센스 계약으로 훈련하는 접근 방식도 있지만, 저작권 자료를 인터넷에서 스크래핑하는 것은 수익과 기술적 우위를 위한 경쟁에서 훨씬 더 논란이 되고, 불법적일 수 있는 전략을 나타냅니다.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles