В значительном шаге вперед в области искусственного интеллекта Apple недавно запустила OpenELM — серию открытых языковых моделей (LLMs), которые могут работать непосредственно на устройствах без необходимости подключения к облачным серверам. Эта инновация не только укрепляет лидерство Apple в AI, но и вносит революционные изменения в исследование и применение обработки естественного языка.
Запуск OpenELM расширяет доступные ресурсы AI на платформе Hugging Face, предоставляя исследователям и разработчикам по всему миру совместное и инновационное пространство. Серия включает восемь версий модели: четыре предобученные с использованием библиотеки CoreNet и четыре тонко настроенные для специфических сценариев применения.
Apple применила стратегию многослойного масштабирования при разработке OpenELM, эффективно распределяя параметры по каждому слою модели трансформера, что привело к заметному увеличению точности. С бюджетом в около одного миллиарда параметров OpenELM увеличивает точность модели OLMo на 2,36%, одновременно снижая необходимый объем данных для предобучения на половину.
Важно отметить, что вместе с выпуском OpenELM Apple предоставила исходный код модели, предобученные веса, полные журналы обучения, несколько контрольных точек и конфигурацию предобучения. Такой открытый подход облегчает воспроизведение и оптимизацию модели исследователями и разработчиками, ускоряя прогресс в области обработки естественного языка.
Apple заявила, что цель запуска OpenELM — «наделить и обогатить открытое исследовательское сообщество» передовыми языковыми моделями, предлагая исследователям средства для изучения рисков, данных и предвзятости моделей. Разработчики и компании могут непосредственно использовать или изменять модели для различных практических задач.
Кроме того, инициатива с открытым исходным кодом позволяет Apple привлекать ведущих инженеров, ученых и экспертов. Политика прозрачного обмена информацией предоставляет исследователям возможность публиковать статьи — привилегия, которая ранее часто была ограничена секретностью Apple.
Хотя Apple еще не полностью интегрировала свои возможности AI в устройства, ожидается, что iOS 18 представит несколько новых функций искусственного интеллекта. Слухи указывают на то, что Apple планирует запускать свои большие языковые модели непосредственно на устройствах для повышения конфиденциальности пользователей, что в конечном счете обеспечит более плавный и безопасный опыт.
Запуск OpenELM, безусловно, создает прочную основу для развития Apple в области искусственного интеллекта. По мере того как все больше компаний и исследовательских учреждений взаимодействуют с этим проектом с открытым исходным кодом, область обработки естественного языка готова к новым инновациям и прорывам. Приняв инициативы с открытым исходным кодом, Apple демонстрирует свою приверженность продвижению технологий и поддержанию совместных инноваций.