دور شركة آبل في مشهد الذكاء الاصطناعي التوليدي عام 2023
رغم أن شركة آبل كانت أقل ظهورًا في سباق الذكاء الاصطناعي التوليدي لعام 2023، إلا أنها حققت تقدمًا ملحوظًا في هذا المجال، مسهمة بكفاءة في تطوير الذكاء الاصطناعي التوليدي على الأجهزة. تشير الأوراق البحثية والنماذج ومكتبات البرمجة الحديثة من آبل إلى توجه استراتيجي يهدف إلى تعزيز وجودها في هذا السوق الناشئ.
موقع فريد في الاستدلال على الأجهزة
تختلف استراتيجية آبل في الذكاء الاصطناعي التوليدي عن العديد من عمالقة التكنولوجيا الآخرين. وعدم اعتماد آبل على نماذج اللغة الكبيرة المستندة إلى السحابة، يجعلها تعتمد على تكامل عمودي لا مثيل له، حيث تتحكم في جميع جوانب التكنولوجيا بدءًا من أنظمة التشغيل وحتى المعالجات. هذا الاستخدام الفريد يمكن آبل من تحسين النماذج التوليدية للاستدلال على الأجهزة.
تسلط الأبحاث الحديثة الضوء على تقدم آبل. يكشف البحث الصادر في يناير بعنوان "LLM في لمح البصر" عن تقنية تتيح لنماذج اللغة الكبيرة العمل بكفاءة على الأجهزة ذات الذاكرة المحدودة، مثل الهواتف الذكية وأجهزة الكمبيوتر المحمولة. تستخدم هذه الطريقة كل من الذاكرة الديناميكية وذاكرة الفلاش، مع تبديل أوزان النماذج بشكل ديناميكي لتقليل استخدام الذاكرة وزمن الاستدلال، خاصة على شريحة آبل.
قبل ذلك، أشارت أبحاث آبل إلى أن التعديلات على هيكل LLM يمكن أن تقلل من حسابات الاستدلال بمعدل يصل إلى ثلاثة أضعاف مع الحد الأدنى من التنازلات في الأداء. تعتبر هذه التحسينات ضرورية بشكل متزايد مع قيام المطورين بإنشاء تطبيقات تدمج نماذج LLM أصغر تعمل على الأجهزة الاستهلاكية، حيث يمكن أن تؤثر حتى التأخيرات الطفيفة على تجربة المستخدم.
مبادرات المصدر المفتوح
في الأشهر الأخيرة، قدمت آبل عدة نماذج توليدية مفتوحة المصدر، بما في ذلك نموذج Ferret الذي تم إصداره في أكتوبر. Ferret هو نموذج LLM متعدد الوسائط مصمم بحجمين من المعامل: 7 مليارات و13 مليار. تم بناؤه على نموذج Vicuna المفتوح المصدر ونموذج LLaVA للرؤية واللغة، ويوفر آلية فريدة لتوليد الإجابات بناءً على أجزاء معينة من الصور المدخلة، مما يظهر مهارة في التعرف على التفاصيل الصغيرة. هذه القدرة قد تحدث ثورة في تفاعلات المستخدمين مع الأجسام المعروضة عبر كاميرات آيفون أو أجهزة Vision Pro.
بالإضافة إلى ذلك، كشفت آبل عن تقنية تعديل الصور المدعومة من MLLM-Guided Image Editing (MGIE)، وهو نموذج يقوم بتعديل الصور بناءً على مطالبات باللغة الطبيعية. يسمح MGIE بإجراء تعديلات واسعة مثل تغيير السطوع والتباين، فضلاً عن تعديلات مستهدفة لمناطق معينة من الصورة، مما يعزز وظائف أجهزة iOS المستقبلية.
بينما تميل آبل تقليديًا إلى الابتعاد عن مبادرات المصدر المفتوح، فإن الترخيص المستخدم لنموذج Ferret للأغراض البحثية قد يعزز من تفاعل مجتمع المطورين، مما يشجع على التطبيقات المبتكرة.
تعزيز أدوات تطوير البرمجيات
في ديسمبر، أصدرت آبل MLX، مكتبة سهلة الاستخدام لتطوير نماذج التعلم الآلي. تشمل MLX واجهات مألوفة تشبه المكتبات الشهيرة بلغة بايثون مثل NumPy وPyTorch، مع تحسين الأداء لمعالجات آبل مثل M2 وM3. تستخدم تقنيات "الذاكرة المشتركة"، مما يسمح لنماذج التعلم الآلي باستخدام أنواع مختلفة من الذاكرة بكفاءة.
تصميم المكتبة يسهل على المطورين الانتقال بالكود من المكتبات الحالية إلى بيئات آبل، وهي متاحة تحت ترخيص MIT للاستخدام التجاري، مما يشجع على اعتمادها بشكل أوسع.
الخاتمة
تشير التطورات إلى أن آبل تؤسس لانتقال كبير في الذكاء الاصطناعي التوليدي على الأجهزة، مع فرق بحثية وهندسية قوية مستعدة للابتكار. رغم أن آبل قد لا تنافس مباشرة مع نماذج مثل GPT-4، إلا أنها مجهزة بشكل جيد لقيادة الموجة القادمة من LLMs عبر أجهزتها مثل آيفون والساعات الذكية. مع مواصلة آبل استغلال نقاط قوتها، من المحتمل أن يتزايد تأثيرها في مشهد الذكاء الاصطناعي التوليدي على الأجهزة بشكل ملحوظ.