قبل زمن ليس ببعيد، كانت عملية إنشاء الصور ثلاثية الأبعاد مهمة صعبة وتستغرق وقتًا طويلاً، تتطلب إطارات أساسية معقدة، وبرامج متخصصة، وأجهزة قوية. ولكن اليوم، تغيرت الأمورdramatically.
قدمت شركة Stability AI تقنية مبتكرة في الذكاء الاصطناعي التوليدي تُعرف باسم Stable Fast 3D، والتي تتيح إنشاء صور ثلاثية الأبعاد بسرعة من صورة واحدة خلال نصف ثانية فقط. وهذا يمثل تقدمًا كبيرًا في زمن المعالجة، حيث يساهم في إنتاج نتائج أسرع بـ 1200 مرة مقارنةً بالنماذج السابقة مثل Stable Video 3D (SV3D) التي كانت تتطلب ما يصل إلى 10 دقائق لنفس النتائج.
تتيح Stable Fast 3D إمكانيات واسعة، مع تطبيقات محتملة في التصميم، والهندسة المعمارية، وتجارة التجزئة، والواقع الافتراضي، وتطوير الألعاب. يمكنك الوصول إلى هذا النموذج من خلال روبوت الدردشة Stable Assistant من Stability AI، وكذلك عبر واجهة برمجة التطبيقات Stability AI، بالإضافة إلى رخصة المجتمع على موقع Hugging Face.
التكنولوجيا وراء Stable Fast 3D
تستند Stable Fast 3D إلى أعمال Stability AI السابقة مع نموذج TripoSR. في مارس، تعاونت الشركة مع Trip AI لتطوير تقنية توليد الأصول ثلاثية الأبعاد بسرعة.
يصف الباحثون في ورقة بحثية الطرق المبتكرة المستخدمة لإعادة بناء شبكات ثلاثية الأبعاد عالية الجودة بسرعة من الصور الفردية. من خلال دمج عدة تقنيات جديدة، يتناولون التحديات الشائعة في إعادة البناء السريع ثلاثي الأبعاد مع تحسين كل من السرعة وجودة الناتج.
في جوهره، يستخدم Stable Fast 3D شبكة تحويل متقدمة تُنتج ثلاثي الأبعاد تمثيلات حجمية ثلاثية الأبعاد عالية الدقة مباشرة من الصورة المدخلة. تدير هذه الشبكة الدقات الأكبر بكفاءة ودون زيادة كبيرة في المتطلبات الحاسوبية، مما يتيح التقاط تفاصيل أدق وتقليل عيوب التشويش.
علاوةً على ذلك، تتميز النموذج بطريقة فريدة في تقدير المواد والإضاءة. من خلال طريقة احتمالية جديدة، تتنبأ شبكة تقدير المواد بالقيم العالمية للمعادن والخشونة، مما يؤدي إلى تحسين جودة الصورة والتناسق. من الجدير بالذكر أن Stable Fast 3D تدمج أيضًا مكونات أساسية لصورة ثلاثية الأبعاد كاملة— الشبكة، والملمس، وخصائص المواد—في أصل جاهز للاستخدام.
ابتكارات Stability AI المستمرة
تُعرف Stability AI على نطاق واسع بتقنية توليد الصور من النصوص Stable Diffusion. بينما تركز Stable Diffusion على الصور ثنائية الأبعاد، كانت الشركة تواصل تحسين قدراتها في 3D منذ نوفمبر 2023، بدءًا من Stable 3D. وقد عزز الإصدار اللاحق من Stable Video 3D في مارس جودة توليد الصور ثلاثية الأبعاد وأدخل حركة الكاميرا الأساسية لعرض الصور.
لا تتوقف الشركة عند هذا الحد؛ فقد كشفت مؤخرًا عن Stable Video 4D، الذي يدمج الزمن في توليد مقاطع الفيديو القصيرة ثلاثية الأبعاد، مما يدفع حدود الذكاء الاصطناعي التوليدي إلى آفاق جديدة.