최근 미디어 인터뷰에서 유튜브 CEO 닐 모한은 OpenAI의 비디오 생성 AI 모델인 소라(Sora)의 훈련 데이터에 대한 우려를 언급했습니다. 그는 OpenAI가 유튜브 비디오를 모델 훈련에 사용했다는 직접적인 증거는 없지만, 그렇게 할 경우 유튜브의 서비스 약관을 위반하게 된다고 강조했습니다.
모한은 콘텐츠 제작자가 비디오를 업로드할 때 합리적인 사용 권리와 콘텐츠 보호를 포함한 특정 권리를 보유한다고 설명했습니다. 유튜브 서비스 약관에 따르면, 승인 없이 비디오의 일부를 다운로드하여 AI 훈련에 사용하는 것은 명백히 금지되어 있으며, 이러한 행동은 제작자와 플랫폼 간의 신뢰를 저해합니다.
흥미롭게도 모한은 OpenAI에 대한 우려를 표명하면서, 유튜브의 모회사인 구글이 자사 AI 모델인 제미니(Gemini) 훈련에 유튜브 콘텐츠를 사용한 사실을 인정했습니다. 하지만 그들은 이용에 앞서 제작자로부터 허가를 받았고, 관련 계약을 준수했다고 명확히 밝혔습니다. 이는 OpenAI가 데이터 사용을 위해 동일한 승인 절차를 따르지 않았을 가능성을 시사합니다.
OpenAI는 소라 모델의 훈련 데이터 출처에 대해 명확하지 않으며, 미라 무라티 CTO는 유튜브 비디오 사용 여부를 확인하지 않았지만 법적으로 허용된 공개 비디오가 훈련 데이터에 포함될 수 있음을 암시했습니다.
이 상황은 AI 모델 훈련에서 데이터 사용의 적법성에 대한 광범위한 논쟁을 촉발했습니다. AI 기술이 발전함에 따라 데이터의 적법성을 보장하고 제작자 권리를 존중하며 규제 및 산업 기준을 준수하는 것이 업계의 주요焦点이 되고 있습니다.
세계 최대 비디오 플랫폼 중 하나인 유튜브의 콘텐츠 저작권 및 데이터 사용에 대한 입장은 매우 중요합니다. 모한의 발언은 유튜브 비디오의 무단 사용이 AI 모델 훈련에 있어 엄격한 처벌을 받을 것이라는 분명한 메시지를 담고 있습니다.
결국, OpenAI는 훈련 데이터와 관련된 규정 준수를 신중히 고려해야 합니다. 이는 다른 AI 기업과 연구 기관에게도 공공 데이터를 모델 훈련에 활용할 때 저작권과 개인 정보 보호를 존중해야 한다는 경각심을 불러일으키며, 지속 가능하고 책임 있는 AI 개발을 촉진하는 계기가 될 것입니다.