قدم فريق البحث في الذكاء الاصطناعي في شركة آبل نموذج "Depth Pro"، الذي يُعدّ رائداً في مجال إدراك العمق للآلات. لهذه التكنولوجيا القدرة على التأثير في مجالات متنوعة، بما في ذلك الواقع المعزز (AR) والمركبات المستقلة.
ينتج "Depth Pro" خرائط عمق ثلاثية الأبعاد معقدة من صورة ثنائية الأبعاد واحدة في 0.3 ثانية فقط، مما يلغي الحاجة إلى بيانات الكاميرا التقليدية. وُصف هذا التقدم في ورقة بحثية بعنوان "Depth Pro: Sharp Monocular Metric Depth in Less Than a Second"، حيث يمثل إنجازاً بارزاً في تقدير العمق الأحادي، مما يتيح استنتاج العمق من صورة واحدة.
تتعدى تطبيقات هذه التكنولوجيا المجالات، خاصة في المناطق التي تتطلب الوعي المكاني الفوري. قاد الفريق، الذي يشمل أليكسي بوتشكوفسكي وفايدلين كولتون، إلى إنشاء أحد أسرع وأدق الأنظمة ليدرك العمق.
في الاختبارات المقارنة، تفوّق "Depth Pro" على نظرائه، بما في ذلك "Marigold" و "Depth Anything v2" و "Metric3D v2"، حيث التقط تفاصيل دقيقة مثل قوام الفراء والأشياء المعقدة مثل أسلاك أقفاص الطيور. تُحقق هذه الدقة الاستثنائية في جزء من الثانية، مما يضع معيارًا جديدًا في رسم خرائط العمق.
غالبًا ما يعتمد تقدير العمق الأحادي التقليدي على صور متعددة أو بيانات وصفية مثل الأطوال البؤرية. يتجاوز "Depth Pro" هذه التحديات باستخدام وحدة معالجة الرسوميات القياسية لإنتاج خرائط عمق عالية الدقة مع التقاط تفاصيل دقيقة تتجاهلها الأساليب الأخرى.
يعزو الباحثون كفاءة "Depth Pro" إلى معمارية مبتكرة من محولات الرؤية متعددة المقاييس، التي تتيح معالجة السياقات العامة والتفصيلية للصورة بشكل متزامن، مما يحسن بشكل كبير على النماذج الأبطأ والأقل دقة.
تعتبر قدرة "Depth Pro" على تقدير العمق النسبي والمطلق، المعروف باسم "العمق المقياسي"، من الميزات البارزة. يسمح هذا بإجراء قياسات دقيقة في العالم الحقيقي، وهو أمر أساسي لتطبيقات مثل الواقع المعزز، حيث يجب دمج العناصر الافتراضية بدقة في الفضاءات المادية. بالإضافة إلى ذلك، تمكنه القدرة على التعلم بدون بيانات تدريب واسعة النطاق من العمل بفاعلية على صور متنوعة.
“ينتج Depth Pro خرائط عمق مقياسية بمقياس مطلق على صور عشوائية دون الحاجة إلى بيانات وصفية مثل خصائص الكاميرا”، كما أوضح المؤلفون. توسع هذه المرونة التطبيقات المحتملة، من تعزيز تجارب الواقع المعزز إلى تحسين كشف العوائق في المركبات المستقلة.
يحقق "Depth Pro" نجاحًا في العديد من الصناعات. في التجارة الإلكترونية، قد يسمح للمستخدمين بتصور كيفية ملاءمة الأثاث في منازلهم باستخدام هواتفهم المحمولة فقط. في قطاع السيارات، يمكن أن تعزز القدرة على توليد خرائط عمق عالية الجودة بسرعة من التنقل والأمان في السيارات ذاتية القيادة.
وفقًا لفريق البحث، “تم تصميم الطريقة لإنتاج خرائط عمق مقياسية لتمثيل أشكال الأجسام ومقاييسها المطلقة بدقة، مما يقلل بشكل كبير من الوقت والتكلفة المرتبطة بتدريب نماذج الذكاء الاصطناعي التقليدية.”
تمت معالجة واحدة من التحديات الرئيسية في تقدير العمق، والتي تُعرف بـ "البكسلات الطائرة" التي تشوه الصور، بشكل فعال بواسطة "Depth Pro". هذه التحسينات ضرورية للتطبيقات التي تتطلب دقة عالية في إعادة البناء ثلاثي الأبعاد والبيئات الافتراضية. كما يبرع النموذج في كشف الحدود، مما يوفر تقسيمًا فائقًا ضروريًا لمهام مثل تجريد الصور والتصوير الطبي.
في خطوة استراتيجية لتعزيز الابتكار، جعلت آبل "Depth Pro" مفتوح المصدر. تتوفر شيفرة النموذج والأوزان المدربة مسبقًا على GitHub، مما يتيح للمطورين والباحثين استكشاف التكنولوجيا وتحسينها. تتضمن المستودعات تفاصيل شاملة عن بنية النموذج ونقاط التوقف المدربة مسبقًا، مما يشجع الآخرين على البناء على أساس آبل.
يدعو فريق البحث لاستكشاف تطبيقات "Depth Pro" عبر مجالات مثل الروبوتات والتصنيع والرعاية الصحية. كما ذكروا، "نحن نُطلق الشيفرة والأوزان على https://github.com/apple/ml-depth-pro"، مما يشير إلى بداية رحلة أوسع لهذه التكنولوجيا.
بينما يستمر الذكاء الاصطناعي في التطور، يُرسّخ "Depth Pro" معيارًا جديدًا للسرعة والدقة في تقدير العمق الأحادي. يمكن أن تؤثر قدرته على إنشاء خرائط عمق عالية الجودة في الوقت الحقيقي من صور فردية بشكل عميق على الصناعات المعتمدة على الوعي المكاني.
من خلال تمثيل كيفية تحويل الأبحاث المتقدمة إلى حلول عملية، يمثل "Depth Pro" مستقبل الذكاء الاصطناعي في تعزيز التفاعلات مع البيئات ثلاثية الأبعاد. كما اختتم المؤلفون قائلين، “يتفوق Depth Pro بشكل ملحوظ على جميع الأعمال السابقة في تحديد حدود الأجسام، بما في ذلك الهياكل الدقيقة مثل الشعر والفراء والنباتات.” يضع هذا التطور "Depth Pro" في موقع يمكنه من تغيير التطبيقات بدءًا من القيادة الذاتية إلى الواقع المعزز، مما يعيد تشكيل التفاعلات بين الآلات والبشر مع الفضاءات ثلاثية الأبعاد.