Apple 發布新技術論文,揭示 AI 模型訓練細節
7 月 30 日,Apple 發表了一篇技術論文,闡述了其人工智慧系統 Apple Intelligence 的預訓練過程,特別聚焦於兩個主要 AI 模型。該論文名為《Apple Intelligence 的基礎語言模型》,深入探討了這些模型的建構及數據來源。
論文指出,Apple 的基礎模型(AFM)及其相關伺服器技術最初建基於 Google 的「v4 和 v5p 雲 TPU 叢集」,而其軟體則由 Apple 內部開發。雖然有傳言認為 Apple 租用了 Google 的雲基礎設施,但文件中並未明確提及 Google 或 NVIDIA。更有可能的是,Apple 購買了 Google 的硬體,並在自家數據中心部署。
儘管初期依賴 Google 的硬體,但 Apple 的長期策略並未受到影響。該公司已將其自有的 Apple Silicon 晶片硬體整合進數據中心,以處理與 Apple Intelligence 相關的查詢。此外,Apple 還啟動了「Project ACDC」,旨在提升數據中心的 AI 應用。
為了與行業競爭對手如 Microsoft 和 Meta 抗衡,Apple 計劃在未來兩年內投資超過 50 億美元,以升級其 AI 伺服器並獲得數萬個新 AI 單元。此外,Apple 已收購兩家專注於優化 AI 查詢所需數據的公司,分別位於加拿大和法國。