أبل تكشف عن المساعد الذكي الجديد الذي يتمتع بميزات فهم الشاشة والاستجابة الصوتية

أبل تقدم ReALM: نظام ذكاء اصطناعي ثوري

في 2 أبريل، نشرت فريق أبحاث أبل ورقة علمية أعلنت فيها عن تطوير نظام ذكاء اصطناعي مبتكر يسمى ReALM (نمذجة اللغة عبر حَل مسارات المعاني). يُصمَّم هذا النظام لتفسير المحتوى الغامض المعروض على الشاشات بدقة، فضلاً عن حواراته وسياقه المرتبط، مما يسهل التفاعل الطبيعي مع المساعدين الصوتيين.

يستفيد ReALM من نماذج اللغة الكبيرة لتبسيط المهمة المعقدة لفهم العناصر البصرية على الشاشة وتحويلها إلى استفسارات قائمة على اللغة. تُعزز هذه النقلة بشكل كبير أدائه مقارنة بالتقنيات الحالية. وأوضح فريق البحث: "من الضروري أن يفهم المساعدون الصوتيون السياق، مما يتيح للمستخدمين توجيه الأسئلة بناءً على المحتوى المعروض على الشاشة، وهو أمر حيوي لتحقيق تجربة تعتمد على الصوت بشكل حقيقي."

تعزيز قدرات المساعدين الصوتيين

من المميزات البارزة لـ ReALM قدرته على إعادة بناء محتوى الشاشة من خلال تحليل المعلومات والعلاقات المكانية لتوليد تمثيلات نصية. تُعَد هذه القدرة أساسية لالتقاط التخطيط البصري للواجهات. أظهر الباحثون أن هذه الطريقة، بالتعاون مع نماذج اللغة، تفوقت على GPT-4 في المهام ذات الصلة. وأشاروا: "حققنا تحسينات كبيرة مقارنة بالأنظمة الموجودة، حيث نجحنا في تحسين الأداء عند التعامل مع مرReferاءات محتوى متنوعة، بزيادة نسبتها أكثر من 5% في النماذج الصغيرة، ونتائج ملحوظة تفوق GPT-4 في النماذج الأكبر."

التطبيقات العملية والتحديات

تُبرز هذه الأبحاث الإمكانات الهائلة لنماذج اللغة في مهام مثل حل مرReferاءات المحتوى. ومع ذلك، تواجه النماذج الكبيرة الشاملة تحديات في التنفيذ بسبب وقت الاستجابة وقيود الموارد الحاسوبية. تُظهر أبل من خلال هذا البحث المبتكر التزامها المستمر بتحسين قدرات المحادثة وفهم السياق في منتجاتها مثل Siri. ومع ذلك، حذر الباحثون من أن تفسير المحتوى المعروض على الشاشة تلقائيًا لا يزال يواجه تحديات، خاصة عند التعامل مع البيانات البصرية المعقدة، مما قد يتطلب دمجها مع تقنيات الرؤية الحاسوبية والمتعددة الوسائط.

سد الفجوة مع المنافسين في الذكاء الاصطناعي

على الرغم من دخول أبل في مجال الذكاء الاصطناعي لاحقًا، إلا أنها حققت مؤخرًا تقدمًا ملحوظًا. من النماذج متعددة الوسائط التي تدمج القدرات البصرية واللغوية إلى أدوات الرسوم المتحركة المدفوعة بالذكاء الاصطناعي والتقنيات المهنية المتطورة، تواصل مختبرات أبل تحقيق الاختراقات التكنولوجية. بينما تطلق المنافسون مثل Google وMicrosoft وAmazon وOpenAI منتجات ذكاء اصطناعي متقدمة في مجالات مثل البحث وبرامج المكتب، تعمل أبل بنشاط على اللحاق بالركب.

تاريخيًا، كانت أبل محافظة في نهجها الابتكاري، لكنها اليوم تواجه سوقًا سريع التطور في الذكاء الاصطناعي. من المتوقع أن تكشف أبل في مؤتمر المطورين العالمي المقبل في يونيو عن إطار عمل جديد لنماذج اللغة الكبيرة، وChatbot يسمى "AppleGPT"، وخصائص ذكاء اصطناعي أخرى. ذكر الرئيس التنفيذي Tim Cook خلال مكالمة أرباح: "نحن متحمسون لمشاركة تقدمنا في الذكاء الاصطناعي في وقت لاحق من هذا العام." على الرغم من الحفاظ على مستوى منخفض من التعاطي، تثير مبادرات أبل في الذكاء الاصطناعي اهتمام الصناعة.

على الرغم من أن تأخر أبل النسبي في المنافسة يشكل تحديات، فإن وضعها المالي القوي، وولاء العلامة التجارية، والفرق الهندسية من الطراز الأول، وتكامل المنتجات السلس يوفر أساسًا قويًا لقلب الموازين.

Most people like

Find AI tools in YBX