El acuerdo de Apple con Shutterstock, de entre 25 y 50 millones de dólares, resalta la intensa competencia por los datos de entrenamiento de IA.

Apple ha asegurado un acuerdo de licencia fundamental con el proveedor de fotografías de archivo Shutterstock, lo que le permitirá acceder a millones de imágenes para el entrenamiento de sus modelos de inteligencia artificial (IA). Según Reuters, el valor del acuerdo oscila entre 25 y 50 millones de dólares, situando a Apple junto a otros gigantes tecnológicos como Meta, Google y Amazon en la carrera por obtener grandes volúmenes de datos para el desarrollo de IA.

Fuentes internas revelaron a Reuters que Apple se ha unido a estas compañías en la negociación de acuerdos de licencia con Shutterstock en los últimos meses, obteniendo acceso a cientos de millones de imágenes, videos y archivos musicales. Aunque los términos específicos del acuerdo de Apple permanecen confidenciales, Jarrod Yahes, CFO de Shutterstock, confirmó que los acuerdos iniciales con estas empresas tecnológicas variaron entre 25 y 50 millones de dólares, a menudo ampliándose posteriormente.

La demanda de datos de entrenamiento para IA ha dado lugar a un mercado en auge, donde diversas empresas obtienen contenido de múltiples fuentes. Conversaciones con más de 30 expertos de la industria revelaron que los precios varían considerablemente según el tipo de contenido y el comprador. Por ejemplo, Daniela Braga, CEO de la firma de datos de IA Defined.ai, indicó que el costo típico es de 1 a 2 dólares por imagen, de 2 a 4 dólares por video corto y de 100 a 300 dólares por hora para películas más largas, con tarifas de texto alrededor de 0.001 dólares por palabra.

Preocupaciones sobre privacidad y retos legales

A medida que la tecnología de IA evoluciona rápidamente, las preocupaciones sobre el uso de datos para el entrenamiento de modelos se han intensificado. Empresas importantes como OpenAI, Google, Meta y Microsoft han utilizado grandes cantidades de datos en línea, incluyendo materiales protegidos por derechos de autor, a menudo sin permiso o compensación a los creadores originales. Esto ha provocado un gran rechazo por parte de editores y creadores de contenido, quienes afirman que su propiedad intelectual está siendo explotada. Recientemente, The New York Times presentó una demanda contra OpenAI y Microsoft por infracción de derechos de autor, alegando que millones de sus artículos fueron utilizados para entrenar chatbots que ahora compiten con el periódico. La demanda busca miles de millones en daños y la cesación de modelos de IA que incorporan contenido del NYT.

En medio de estas disputas legales, hay llamados a un sistema de licencias donde las empresas de IA compensen a los propietarios de contenido por el acceso a datos de entrenamiento. Durante una audiencia en el Senado, legisladores de ambos lados expresaron apoyo a las demandas de la industria de los medios, abogando por acuerdos de licencia para el desarrollo de IA. Líderes de organizaciones como la Asociación Nacional de Radiodifusores y la Alianza de Medios de Noticias han respaldado el llamado a licencias obligatorias, argumentando que el uso no autorizado de datos infringe la ley de derechos de autor.

Por otro lado, OpenAI y ciertos expertos opinan que una licencia integral puede ser impráctica. Sostienen que tales requisitos podrían concentrar el poder en manos de grandes empresas tecnológicas y crear obstáculos para startups de IA más pequeñas, dando lugar a un debate continuo sobre si la licencia debería convertirse en una obligación legal o permanecer como una norma de la industria.

Mientras el panorama legal cambia, algunas empresas están asegurando acuerdos de datos lucrativos. Por ejemplo, se informa que Google firmó un contrato anual de 60 millones de dólares para acceder de forma exclusiva a los datos de Reddit para sus sistemas de IA. A medida que las preocupaciones sobre la privacidad aumentan, la dinámica en evolución de los datos de entrenamiento de IA será crucial para el futuro de la industria.

La búsqueda de la dominancia en IA

El acuerdo con Shutterstock subraya el papel esencial de los datos en la evolución de sistemas de IA avanzados. A medida que Apple, Google y Meta compiten por desarrollar modelos de IA líderes, el acceso a conjuntos de datos grandes y diversos se vuelve cada vez más vital. Al licenciar millones de imágenes de Shutterstock, Apple busca fortalecer sus capacidades de IA en diversas aplicaciones, incluyendo visión por computadora, generación de imágenes, asistentes virtuales y realidad aumentada.

La disposición de los gigantes tecnológicos a invertir decenas de millones en datos de entrenamiento de IA destaca el significativo potencial económico de esta tecnología. Con la IA haciéndose integral en sectores como la salud, las finanzas, el entretenimiento y la educación, se espera que el mercado de soluciones impulsadas por IA experimente un crecimiento exponencial en los próximos años. Al invertir fuertemente en IA ahora, Apple y sus pares se están posicionando para capturar una parte sustancial de este mercado en expansión.

Aunque Apple no ha revelado detalles específicos sobre el acuerdo con Shutterstock, ha afirmado su compromiso de desarrollar sistemas de IA de manera reflexiva y ética, enfatizando su respeto por los derechos de propiedad intelectual.

El mercado de datos para IA, que hoy se valora en aproximadamente 2.5 mil millones de dólares y se proyecta que aumentará a casi 30 mil millones en una década, refleja la alta competencia por la supremacía de la IA entre los líderes tecnológicos. A medida que la industria navega por las complejidades de este panorama impulsado por datos, las consecuencias a largo plazo para la privacidad del usuario y los derechos de datos serán de gran relevancia.

Most people like

Find AI tools in YBX