애플, AI 모델 훈련 세부 사항 공개
7월 30일, 애플은 자사의 인공지능 시스템인 Apple Intelligence의 사전 훈련 과정을 설명하는 기술 논문을 발표했습니다. "Apple Intelligence를 위한 기초 언어 모델"이라는 제목의 이 논문은 두 가지 주요 AI 모델의 구조와 데이터 출처에 대한 깊이 있는 통찰을 제공합니다.
이 논문에 따르면, 애플의 기초 모델(AFM)과 관련 서버 기술은 초기에는 구글의 "v4 및 v5p 클라우드 TPU 클러스터"를 기반으로 구축되었으며, 소프트웨어는 애플이 직접 개발했습니다. 애플이 구글의 클라우드 인프라를 임대했을 것이라는 추측이 있었지만, 문서에는 구글이나 NVIDIA에 대한 명시적인 언급은 없습니다. 더 가능성 있는 시나리오는 애플이 구글의 하드웨어를 구입해 자사의 데이터 센터에 배치했다는 것입니다.
구글의 하드웨어에 처음 의존했더라도, 애플의 장기 전략은 변하지 않았습니다. 애플은 자사의 데이터 센터에 독자적인 Apple Silicon 칩 기반 하드웨어를 통합하여 Apple Intelligence 관련 쿼리를 관리하고 있으며, 데이터 센터 내 AI 애플리케이션을 강화하기 위한 "Project ACDC"를 시작했습니다.
마이크로소프트와 메타와 같은 경쟁 업체에 맞서기 위해, 애플은 향후 2년 동안 AI 서버 업그레이드와 수만 개의 새로운 AI 장비 확보에 50억 달러 이상을 투자할 계획입니다. 추가로 애플은 AI 쿼리에 필요한 데이터를 최적화하는 두 개의 캐나다와 프랑스 기반 회사도 인수했습니다.