توسع Stability AI قدرات توليد الصور من خلال Stable Diffusion Medium

ليس بالضرورة أن يكون الأكبر هو الأفضل، خاصة عند تشغيل نماذج الذكاء الاصطناعي التوليدية على أجهزة الكمبيوتر التجارية. هذه الفكرة تؤكد على إطلاق Stability AI الأخير: Stable Diffusion 3 Medium. كنموذج رائد لشركة Stability AI، يتفوق Stable Diffusion في توليد الصور من النصوص. تم مشاركة نظرة أولية على Stable Diffusion 3 في 22 فبراير، وبدأ الوصول العام إلى واجهة برمجة التطبيقات في 17 أبريل.

تم تصميم Stable Diffusion Medium ليكون نموذجًا أصغر ولكنه ذو كفاءة عالية يعمل بفاعلية على بطاقات الرسومات من الفئة الاستهلاكية. مما يجعله خيارًا جذابًا للمستخدمين والمؤسسات ذات الموارد المحدودة التي تبحث عن تكنولوجيا فعّالة لتوليد الصور.

يمكن اختبار Stable Diffusion Medium من خلال واجهة برمجة التطبيقات وعلى خدمة Stable Artisan عبر Discord. بالإضافة إلى ذلك، يمكن الوصول إلى أوزان النموذج للاستخدام غير التجاري على Hugging Face.

مع تقديم Stable Diffusion Medium، أصبح الإصدار الأول معروفًا الآن باسم Stable Diffusion 3 (SD3) Large، والذي يتضمن 8 مليار معامل. في المقابل، يحتوي SD3 Medium على 2 مليار معامل. وفقًا لكريستيان لافورتي، الشريك التنفيذي في Stability AI، "على عكس SD3 Large، فإن SD3 Medium أصغر وسيعمل بكفاءة على أجهزة المستهلك."

لتشغيل Stable Diffusion Medium، يحتاج المستخدمون فقط إلى 5 جيجابايت من VRAM للبطاقة الرسومية، مما يتيح له العمل على مجموعة متنوعة من أجهزة الكمبيوتر الشخصية واللابتوبات المتطورة. على الرغم من أن هذا هو الحد الأدنى من المتطلبات، توصي Stability AI بوجود 16 جيجابايت من VRAM لتحقيق الأداء الأمثل، وهو ما قد يكون تحديًا لبعض من أجهزة اللابتوب.

على الرغم من حجمه الأصغر، يتمتع SD3 Medium بميزات مثيرة للإعجاب مقارنةً بـ SD3 Large. يؤكد لافورتي أن SD3 Medium يتفوق في الواقعية الضوئية، والالتزام بالمطالبة النصية، والطباعة، وكفاءة الموارد، والتحسين. "يوازي SD3 Medium قدرات واجهة برمجة التطبيقات لـ SD3 Large التي يقدرها المستخدمون اليوم"، حسب قوله.

يمكن للمستخدمين توقع مخرجات صورة واقعية للغاية من SD3، بفضل VAE القابل للتغيير بـ 16 قناة، والذي يوفر تفاصيل أكبر لكل ميغابكسل مقارنةً بالنماذج السابقة. يظهر SD3 أيضًا التزامًا ملحوظًا بالمطالب النصية بلغة طبيعية، بما في ذلك الوعي المكاني في تكوين الصورة.

تجعل قدرات التحسين الخاصة بالنموذج قابلًا للتكيف وفعالًا في التقاط التفاصيل من مجموعات بيانات التحسين. كما أن تحسين الطباعة يعد من التعزيزات الهامة التي تتواجد في SD3 والتي انتقلت إلى SD3 Medium.

الميزة البارزة في SD3 Medium هي كفاءة الموارد. "تصغر حجم ونمطية النموذج الذي يحتوي على 2 مليار معامل يقلل من المتطلبات الحاسوبية دون التضحية بالأداء"، أشار لافورتي. "هذا يجعل SD3 Medium الخيار المثالي في البيئات التي تكون إدارة الموارد فيها حرجة."

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles