Apple раскрывает детали обучения ИИ в новом техническом документе
30 июля Apple опубликовала технический документ, описывающий процесс предварительного обучения своей системы искусственного интеллекта Apple Intelligence, с акцентом на две ключевые модели ИИ. Документ под названием "Основные языковые модели для Apple Intelligence" предлагает глубокое понимание конструкции моделей и источников данных.
В документе отмечается, что Основная Модель Apple (AFM) и связанная с ней серверная технология изначально создавались на основе кластеров Cloud TPU v4 и v5p компании Google, при этом программное обеспечение разрабатывалось внутри компании. Хотя существовали предположения о том, что Apple арендует облачную инфраструктуру Google, в документе ни разу не упоминаются ни Google, ни NVIDIA. Скорее всего, Apple приобрела оборудование Google и разместила его в своих собственных дата-центрах.
Несмотря на первоначальное использование оборудования Google, долгосрочная стратегия Apple остается неизменной. Компания интегрировала собственные чипы Apple Silicon в свои дата-центры для обработки запросов, связанных с Apple Intelligence. Кроме того, Apple запустила "Проект ACDC", направленный на улучшение AI-приложений в своих дата-центрах.
Чтобы конкурировать с такими игроками отрасли, как Microsoft и Meta, Apple планирует инвестировать более 5 миллиардов долларов в следующие два года для модернизации своих AI-серверов и приобретения десятков тысяч новых единиц ИИ. Кроме того, Apple приобрела две компании из Канады и Франции, специализирующиеся на оптимизации данных для AI-запросов.