Apple, NVIDIA y Anthropic Supuestamente Usaron Transcripciones de YouTube Sin Consentimiento para el Entrenamiento de Modelos de IA

Home Noticias de IA Apple, NVIDIA y Anthropic Supuestamente Usaron Transcripciones de YouTube Sin Consentimiento para el Entrenamiento de Modelos de IA

Una investigación de Proof News ha revelado que algunas de las mayores empresas tecnológicas, como Apple, NVIDIA y Anthropic, entrenaron sus modelos de IA utilizando un conjunto de datos que incluye transcripciones de más de 173,000 videos de YouTube, sin obtener el permiso de los creadores. Este conjunto de datos, compilado por la organización sin fines de lucro EleutherAI, contiene transcripciones de canales que representan a más de 48,000 creadores, incluyendo figuras destacadas como Marques Brownlee y MrBeast, así como importantes organizaciones de noticias como The New York Times, BBC y ABC News.

La investigación pone de manifiesto una preocupante realidad en el desarrollo de la IA: gran parte de la tecnología depende de datos extraídos de creadores sin su consentimiento o compensación. Aunque el conjunto de datos no incluye videos ni imágenes, sí incorpora contribuciones significativas de influyentes creadores de contenido.

Marques Brownlee expresó su preocupación en las redes sociales, señalando que Apple obtuvo datos de diversas empresas, una de las cuales recolectó transcripciones de videos de YouTube, incluido el suyo. Afirma: “Este será un problema en evolución durante mucho tiempo”, reconociendo el complejo paisaje ético que rodea el uso de datos en la IA.

Un portavoz de Google reiteró que las declaraciones del CEO de YouTube, Neal Mohan, sobre la violación de los términos de servicio de la plataforma por parte de empresas que usan datos de YouTube para el entrenamiento de IA siguen vigentes. Los intentos de obtener comentarios de Apple, NVIDIA, Anthropic y EleutherAI no han tenido respuesta.

La transparencia respecto a los datos de entrenamiento utilizados por las empresas de IA sigue siendo un tema esquivo. Recientemente, Apple fue criticada por artistas y fotógrafos por no revelar la fuente de los datos de entrenamiento para su próxima función de IA generativa, Apple Intelligence. En respuesta, Apple aclaró que su modelo OpenELM—creado estrictamente para investigación—no alimenta sus capacidades de IA o aprendizaje automático. La empresa afirmó que sus modelos de IA se entrenan con "datos licenciados" y con información de dominio público recopilada por arañas web.

YouTube, como el mayor repositorio de videos del mundo, proporciona una abundante cantidad de transcripciones, audios, videos e imágenes, convirtiéndolo en un recurso atractivo para el desarrollo de modelos de IA. A principios de este año, la CTO de OpenAI, Mira Murati, evitó responder si se utilizaron videos de YouTube para entrenar Sora, la próxima herramienta de generación de video de IA de OpenAI, afirmando que los datos eran de acceso público o licenciados.

Si estás interesado en averiguar si los subtítulos de tus videos de YouTube o los de tus canales favoritos están incluidos en este conjunto de datos, visita la herramienta de búsqueda de Proof News.

La Nueva IA de Tinder Elegirá tus Mejores Fotos para Atraer Mejores Coincidencias

OpenAI Desarrollando Modelos de IA Avanzados para Mejorar las Capacidades de Razonamiento e Investigación Profunda

Most people like

VideoToPage

9.9K

Desbloquea el potencial completo de tus videos y grabaciones de audio al reutilizarlos en contenido cautivador. Esta guía te mostrará cómo convertir eficazmente tu multimedia en publicaciones de blog, actualizaciones en redes sociales, podcasts y más. Al aprovechar tus activos existentes, puedes ampliar tu alcance, involucrar a tu audiencia y maximizar el impacto de tu contenido. Descubre el arte de la transformación de contenido y haz que tu multimedia brille.

resumen de video Summarizer

Supernormal

469.6K

Supernormal es una potente herramienta de IA diseñada para optimizar el proceso de documentación de notas de reuniones, ahorrándote un tiempo valioso mediante una automatización eficiente.

IA AI Meeting Assistant

Free 3D Animation

35.6K

Desata tu creatividad y crea animaciones 3D cautivadoras sin esfuerzo—¡sin necesidad de programación! Ya seas un animador en ciernes o un profesional experimentado, nuestras herramientas intuitivas hacen que la animación sea accesible para todos. ¡Sumérgete en el mundo del diseño 3D y convierte tus ideas en animaciones visualmente impactantes hoy mismo!

animación 3D Other

By the Numbers-Shopify Analytics

15.5K

Descubre estrategias esenciales para mejorar tu negocio en Shopify y desbloquear valiosas ideas que impulsan el crecimiento.

Analítica de Shopify AI Analytics Assistant

Find AI tools in YBX