Startup de Vídeo AI Runway Supostamente Treinou em Milhares de Vídeos do YouTube Sem Autorização

A empresa de inteligência artificial Runway teria coletado "milhares" de vídeos do YouTube e pirateado filmes protegidos por direitos autorais sem a devida autorização. O veículo investigativo 404 Media obteve planilhas internas que indicam que a startup de geração de vídeos com IA treinou seu modelo Gen-3 usando conteúdo de canais pertencentes a grandes entidades como Disney, Netflix e Pixar.

Um ex-funcionário anônimo da Runway revelou que essas planilhas foram utilizadas para identificar vídeos para o banco de dados da empresa, que foram baixados de forma não detectada usando software de proxy de código aberto. Uma das planilhas continha palavras-chave simples — como "astronauta", "fada" e "arco-íris" — com anotações sobre a disponibilidade de vídeos de treinamento de qualidade. Por exemplo, a palavra-chave "super-herói" tinha uma nota que dizia: “Muitos trechos de filmes.” Outras anotações indicavam que canais focados em Unreal Engine, no cineasta Josh Neuman e uma página de fãs de Call of Duty eram considerados excelentes fontes para vídeos de "alto movimento".

"As planilhas representavam um esforço da empresa para descobrir vídeos de qualidade para o desenvolvimento do modelo," afirmou o ex-funcionário. "Isso levou à criação de um enorme crawler que baixava vídeos de todos os canais listados, usando proxies para evitar a detecção pelo Google."

A planilha incluía quase 4.000 canais do YouTube sinalizados como "recomendados", apresentando conteúdo de CBS New York, AMC Theaters, Pixar, Disney Plus e até mesmo do Aquarium de Monterey Bay. A Runway também teria acumulado uma lista separada de vídeos de sites de pirataria, com uma planilha intitulada "Fonte Não-YouTube" apresentando links para arquivos não autorizados de filmes do Studio Ghibli e várias plataformas de pirataria de anime e filmes.

Para validar ainda mais as alegações de uso de dados não autorizado, a 404 Media descobriu que inserir os nomes de YouTubers populares listados na planilha resultava em resultados marcadamente semelhantes. Em contraste, usar os mesmos nomes com o modelo Gen-2 mais antigo da Runway — treinado em dados diferentes — resultava em saídas irrelevantes, como imagens genéricas de homens de terno. Notavelmente, após a 404 Media questionar sobre a semelhança dos YouTubers nos resultados, a ferramenta de IA parou de gerar essas semelhanças.

"Espero que compartilhar essa informação ajude as pessoas a entender a extensão dessas empresas e seus métodos para gerar vídeos ' legais'," comentou o ex-funcionário.

Quando contatada para comentar, uma representante do YouTube mencionou uma entrevista de abril com o CEO Neal Mohan, que caracterizou o treinamento de seus vídeos como uma "clara violação" dos termos do YouTube. "Nossos comentários anteriores sobre isso ainda se mantêm," afirmou. A Runway não respondeu ao pedido de comentário antes do prazo do veículo.

À medida que o cenário da IA continua a evoluir, algumas empresas podem estar se esforçando para estabelecer domínio de mercado antes que consumidores e sistemas jurídicos compreendam totalmente as implicações de suas práticas. Enquanto o treinamento com autorização por meio de acordos licenciados é uma abordagem — adotada por empresas como a OpenAI — a coleta de material protegido por direitos autorais representa uma estratégia muito mais contenciosa, senão ilegal, na corrida por lucro e supremacia tecnológica.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles