Apple Revela Detalles sobre el Entrenamiento de Modelos de IA en un Nuevo Artículo Técnico
El 30 de julio, Apple publicó un artículo técnico que describe el proceso de pre-entrenamiento detrás de su sistema de inteligencia artificial, Apple Intelligence, con un enfoque específico en dos modelos de IA clave. Titulado "Modelos de Lenguaje Fundamentales para Apple Intelligence", el documento ofrece una visión exhaustiva sobre la construcción de los modelos y sus fuentes de datos.
El artículo indica que el Modelo Fundamental de Apple (AFM) y su tecnología de servidor asociada se construyeron inicialmente sobre "clusters Cloud TPU v4 y v5p de Google", con software desarrollado internamente por Apple. Aunque ha habido especulaciones sobre si Apple alquila la infraestructura en la nube de Google, el documento no menciona explícitamente a Google o NVIDIA. Es más probable que Apple haya comprado el hardware de Google y lo haya desplegado en sus propios centros de datos.
A pesar de la dependencia inicial del hardware de Google, la estrategia a largo plazo de Apple no se ve afectada. La compañía ha integrado su hardware basado en el chip Apple Silicon en sus centros de datos para gestionar consultas relacionadas con Apple Intelligence. Además, Apple ha lanzado el "Proyecto ACDC", con el objetivo de mejorar las aplicaciones de IA en sus centros de datos.
Para competir con rivales de la industria como Microsoft y Meta, Apple planea invertir más de 5 mil millones de dólares en los próximos dos años para actualizar sus servidores de IA y adquirir decenas de miles de nuevas unidades de IA. Además, Apple ha adquirido dos empresas con sede en Canadá y Francia que se especializan en optimizar los datos necesarios para las consultas de IA.