蘋果公司與股票攝影供應商Shutterstock達成了一項重要的授權協議,獲得數百萬影像以用於其人工智慧(AI)模型的訓練。根據路透社報導,此交易價值在2500萬至5000萬美元之間,使蘋果與Meta、谷歌和亞馬遜等科技巨頭在AI發展所需的大數據競賽中並肩作戰。
知情人士告訴路透社,蘋果最近幾個月與這些公司一同與Shutterstock簽署授權協議,獲得數億張影像、影片和音樂檔案的使用權。儘管蘋果協議的具體條款仍然保密,Shutterstock的首席財務官Jarrod Yahes確認與這些科技公司最初的交易範圍從2500萬至5000萬美元,並且往往會在後期擴展。
AI訓練數據的需求引發了繁榮的市場,各公司正在多方尋找內容。與超過30位業界內部人士的對話顯示,根據內容類型和買方,價格差異相當大。例如,AI數據公司Defined.ai的首席執行官Daniela Braga指出,典型的成本為每張影像1-2美元、每段短影片2-4美元、長片的每小時100-300美元,文字每字大約0.001美元。
隱私擔憂與法律挑戰
隨著AI技術的迅速發展,對於訓練模型時數據使用的擔憂也加劇。OpenAI、谷歌、Meta和微軟等主要公司利用了大量的在線數據,包括著作權材料,常常在未經原創者同意或補償的情況下使用,這導致出版商和創作者的強烈反彈。最近,《紐約時報》對OpenAI和微軟提出了侵權訴訟,指控他們使用數百萬篇文章來訓練現在與該報競爭的聊天機器人,訴訟要求賠償數十億美元並停止使用包含NYT內容的AI模型。
在這些法律爭議中,呼籲建立一個授權系統,使AI公司能夠補償內容擁有者以獲取訓練數據。在參議院聽證會上,兩黨立法者都表達了對媒體產業要求的支持,倡導對AI開發進行授權協議。來自全國廣播公司和新聞媒體聯盟等組織的領導者則主張強制授權,指出未經授權使用數據侵犯了著作權法。
反之,OpenAI及某些專家認為全面授權或許不切實際。他們認為這樣的要求可能會集中權力於較大的科技公司,對較小的AI新創公司造成挑戰,這引發了關於授權是否應該成為法律義務或僅為業界標準的持續辯論。
隨著法律環境的變化,一些公司正在簽署有利可圖的數據協議。例如,谷歌報導已簽署了一份價值6000萬美元的年度合約,以獲得Reddit數據的獨家使用權。隨著隱私擔憂加劇,AI訓練數據的變化動態將對該行業的未來至關重要。
爭奪AI主導權
Shutterstock的協議凸顯了數據在高級AI系統演變中的關鍵角色。隨著蘋果、谷歌和Meta競相開發領先的AI模型,獲得大型且多樣的數據集愈加重要。透過授權數百萬張Shutterstock影像,蘋果旨在提升其在計算機視覺、影像生成、虛擬助理和擴增實境等不同應用中的AI能力。
科技巨頭對AI訓練數據投入數千萬的意願顯示了這項技術的巨大經濟潛力。隨著AI成為醫療、金融、娛樂和教育等領域的核心,預計市場對AI驅動解決方案的需求在未來幾年將呈指數增長。通過在現階段大力投資AI,蘋果及其同行正為在這個擴張中的市場中爭取可觀的份額做準備。
儘管蘋果尚未披露Shutterstock交易的具體細節,但已確認其致力於以周到和倫理的方式發展AI系統,並強調尊重知識產權。
目前,迅速發展的AI數據市場估計價值約25億美元,預計在十年間將飆升至近300億美元,反映出科技領袖在AI主導權競爭中的高風險。隨著行業在這個數據驅動的環境中發展,對用戶隱私和數據權利的長期影響也逐漸突顯。