苹果公司与图库提供商Shutterstock达成了一项重要的许可协议,使其能够访问数百万张图片以用于训练人工智能(AI)模型。根据路透社的报道,这项交易的价值在2500万到5000万美元之间,使苹果与Meta、谷歌和亚马逊等科技巨头齐名,共同争夺用于AI开发的海量数据。
消息人士透露,苹果在过去几个月与Shutterstock达成了许可协议,获取了数亿张图片、视频和音乐文件的使用权。虽然苹果协议的具体条款尚未公开,但Shutterstock的首席财务官贾罗德·雅赫斯确认,与这些科技公司的初步交易通常在2500万到5000万美元之间,后续也可能扩展。
随着对AI训练数据需求的激增,市场变得异常活跃,许多公司通过多种渠道获取内容。与30多位行业内人士的交谈显示,内容类型和买方不同,价格差异相当大。例如,AI数据公司Defined.ai的首席执行官达尼埃拉·布拉加指出,典型的图像费用在每张1到2美元之间,短视频在2到4美元,长片的费用则在每小时100到300美元,文本费用约为每字0.001美元。
隐私问题与法律挑战
随着AI技术的快速发展,对数据使用的担忧日益加剧。OpenAI、谷歌、Meta和微软等大型公司利用了大量在线数据,包括未经许可的受版权保护材料,常常不给原作者任何补偿。这导致了出版商和内容创作者的强烈反对,认为他们的知识产权受到侵害。近日,《纽约时报》对OpenAI和微软提起了版权侵权诉讼,声称数百万篇文章被用来训练与该报竞争的聊天机器人。诉讼要求数十亿美元的赔偿,并要求停止使用包含《纽约时报》内容的AI模型。
在这些法律争端中,人们呼吁建立一个许可系统,以便AI公司对内容所有者进行补偿。在一次参议院听证会上,两党立法者对媒体行业的要求表示支持,提倡为AI开发制定许可协议。全国广播协会和新闻媒体联盟等组织的领导人表示支持强制许可,认为未经授权的数据使用侵犯了版权法。
相对而言,OpenAI及某些专家认为全面的许可可能不切实际。他们认为,这种要求可能会将权力集中在大型科技公司手中,并给较小的AI初创公司带来挑战,从而引发关于许可是否应该成为法律义务或保持行业标准的持续辩论。
法律环境的变化使一些公司获得了丰厚的数据协议。例如,谷歌 reportedly签署了一项价值6000万美元的年度合同,以获取Reddit数据的独家访问权。随着隐私问题的加剧,AI训练数据的演变对行业未来至关重要。
争夺AI主导权
Shutterstock协议凸显了数据在先进AI系统发展过程中的重要作用。苹果、谷歌和Meta等公司竞相开发领先的AI模型,获得大型多样数据集变得日益重要。通过许可数百万张Shutterstock图片,苹果旨在增强其在计算机视觉、图像生成、虚拟助手和增强现实等各类应用中的AI能力。
科技巨头在AI训练数据上投资数千万美元,展示了这一技术的巨大经济潜力。随着AI在医疗、金融、娱乐和教育等多个领域变得不可或缺,预计未来几年以AI为驱动的解决方案市场将经历指数级增长。通过当前对AI的重金投入,苹果及其竞争对手正为占据这一扩张市场的重大份额做好准备。
虽然苹果尚未透露Shutterstock协议的具体细节,但已重申对以审慎和伦理的方式开发AI系统的承诺,并强调对知识产权的尊重。
如今,AI数据市场的估值约为25亿美元,预计在十年内将飙升至近300亿美元,反映出科技领袖在争夺AI主导地位过程中面临的高风险。在行业应对这一数据驱动环境的复杂性时,用户隐私和数据权利的长期后果也日益显得重要。