Раскрытие стратегии генеративного ИИ Apple: ключевые идеи и направления будущего

Роль Apple в ландшафте генеративного ИИ 2023 года

Несмотря на то что Apple оставалась в тени в гонке генеративного ИИ в 2023 году, компания добилась значительных успехов в этой области, тихо развивая генеративный ИИ на устройствах. Недавние научные статьи, модели и библиотеки программирования от Apple указывают на стратегическое направление, направленное на укрепление позиций в этом развивающемся рынке.

Уникальная позиция в обработке данных на устройствах

Подход Apple к генеративному ИИ отличается от тактики многих других технологических гигантов. Не обладая возможностями гиперскейлинга, Apple не может полагаться на облачные большие языковые модели (LLM) в своей бизнес-модели. Тем не менее, компания обладает непревзойденной вертикальной интеграцией, контролируя весь технологический стек — от операционных систем до процессоров. Это дает Apple уникальную возможность оптимизировать генеративные модели для обработки данных на устройствах.

Недавние исследования подчеркивают достижения Apple. Статья января под названием "LLM за мгновение" представляет метод, позволяющий LLM эффективно работать на устройствах с ограниченной памятью, таких как смартфоны и ноутбуки. Этот метод стратегически использует как DRAM, так и флэш-память, динамически меняя веса модели для минимизации загрузки памяти и задержки вывода, особенно на Apple silicon.

Ранее исследования Apple показали, что модификации архитектуры LLM могут снизить вычисления вывода до трех раз с минимальными потерями производительности. Такие оптимизации становятся все более важными, поскольку разработчики создают приложения, интегрирующие меньшие LLM, которые могут работать на потребительских устройствах; даже малейшие задержки могут отрицательно сказаться на общем пользовательском опыте.

Открытые инициативы

В последние месяцы Apple представила несколько открытых генеративных моделей, включая Ferret, выпущенный в октябре. Ferret — многомодальная LLM с двумя размерами параметров: 7 миллиардов и 13 миллиардов. Созданный на основе открытой LLM Vicuna и модели языка и зрения LLaVA, Ferret обладает уникальным механизмом генерации ответов на основе определенных частей входных изображений, демонстрируя умение распознавать мелкие детали. Эта способность может кардинально изменить взаимодействие пользователей с объектами, просматриваемыми через камеры iPhone или устройства Vision Pro.

Кроме того, Apple представила MLLM-Guided Image Editing (MGIE) — модель, которая изменяет изображения на основе естественных языковых запросов. MGIE позволяет проводить как широкие изменения, такие как настройка яркости и контрастности, так и целевые модификации конкретных областей изображения, повышая функциональность будущих устройств iOS.

Хотя Apple традиционно избегает открытых инициатив, лицензирование Ferret для исследовательских целей может способствовать более активному сообществу разработчиков, стимулируя innovative приложения.

Улучшенные инструменты разработки программного обеспечения

В декабре Apple выпустила MLX, удобную библиотеку для разработки моделей машинного обучения. MLX включает в себя знакомые интерфейсы, похожие на популярные библиотеки Python, такие как NumPy и PyTorch, и в то же время оптимизирована для производительности на процессорах Apple, таких как M2 и M3. Она использует методы "разделяемой памяти", позволяя моделям ML эффективно использовать разные типы памяти.

Дизайн библиотеки упрощает процесс перехода разработчиков с существующих библиотек на платформу Apple и доступна под лицензией MIT для коммерческого использования, что способствует широкому внедрению.

Заключение

Текущие тенденции показывают, что Apple закладывает основу для значительного изменения в генеративном ИИ на устройствах, с мощными научными и инженерными командами, готовыми к инновациям. Хотя Apple может не конкурировать напрямую с моделями, подобными GPT-4, она хорошо подготовлена для формирования следующей волны LLM на своих устройствах, таких как iPhone и смарт-часах. По мере того как Apple продолжает использовать свои сильные стороны, ее влияние на ландшафт генеративного ИИ на устройствах, скорее всего, значительно вырастет.

Most people like

Find AI tools in YBX