NVIDIA Enfrenta Desafios Legais por Conteúdo Protegido em Treinamento de IA
Documentos recentes revelados pelo veículo de tecnologia 404Media mostram que a NVIDIA acumulou uma quantidade significativa de conteúdo protegido por direitos autorais durante o treinamento de seus sistemas de inteligência artificial (IA). Esses documentos incluem e-mails internos, conversas no Slack e outros materiais relacionados, indicando que a NVIDIA obteve dados de diversas plataformas de vídeo, como YouTube, para aprimorar seus conjuntos de dados de treinamento de IA.
Nas discussões, os funcionários envolvidos no projeto expressaram preocupações sobre os riscos legais de compilar conjuntos de dados de vídeos do YouTube para fins de pesquisa. No entanto, um gerente de projeto garantiu que essa abordagem de coleta de dados havia sido aprovada por executivos da empresa e assegurou que a prática estava "totalmente em conformidade com a letra e o espírito da lei de direitos autorais."
Segundo um funcionário da NVIDIA, a empresa instruiu equipes a coletar vídeos de plataformas como YouTube e Netflix para treinar seu gerador 3D Omniverse, sistemas de direção autônoma e produtos digitais humanos. Relatórios indicam que o projeto, denominado internamente de "Cosmos", utiliza máquinas virtuais com endereços IP rotativos para contornar os mecanismos de detecção de conteúdo do YouTube, evitando assim proibições.
O funcionário observou: "Estamos usando a plataforma AWS, e reiniciar instâncias atribui um novo IP público, então isso não é um problema por enquanto."
À medida que a tecnologia de IA avança, o desafio de usar conteúdo protegido de forma legal e ética para treinamento tornou-se uma preocupação significativa para a indústria de tecnologia.