بعد شهرين فقط من العرض التجريبي، يسرّ Stability AI أن تطلق نموذجها الجديد للذكاء الاصطناعي التوليدي Stable Diffusion 3، إلى جانب العرض المبكر لتكنولوجيا الدردشة المبتكرة المعروفة باسم "Stable Assistant".
تم الإعلان عن Stable Diffusion 3 في فبراير كعرض تجريبي، والآن يمكن الوصول إليه عبر واجهة برمجة التطبيقات (API) على منصة مطوري Stability AI. تمكن هذه الواجهة من دمج قدرات النموذج القوية في توليد النصوص إلى صور بسهولة ضمن خدمات وتطبيقات متنوعة. بالإضافة إلى ذلك، تم تقديم إصدار Turbo—Stable Diffusion 3 Turbo—لأداء معزز.
مع Stable Diffusion 3، تستخدم Stability AI تقنيات متقدمة في التعلم الآلي تهدف إلى تحسين جودة الصور والطباعة بشكل كبير. وكان تركيزنا الأساسي خلال إصدار واجهة برمجة التطبيقات هو ضمان جاهزية النموذج للاستخدام في الإنتاج.
قال كريستيان لافورتي، المدير التقني والرئيس التنفيذي المؤقت لـ Stability AI: "لقد قمنا بتنفيذ العديد من التدابير الوقائية لمنع إساءة استخدام SD3، ونقوم بتجديد هذه التدابير باستمرار بناءً على ملاحظات المستخدمين."
نموذج مفتوح قريبًا
بينما أصبح Stable Diffusion 3 متاحًا عبر واجهة برمجة التطبيقات، لم يتم إصدار نموذج مفتوح بعد ولكنه في الطريق. وأكد لافورتي: "سنستمر في تحسين النموذج قبل إصداره بشكل مفتوح. وفقًا لالتزامنا بالذكاء الاصطناعي التوليدي المفتوح، سنجعل قريبًا أوزان النموذج متاحة للاستضافة الذاتية من خلال عضوية Stability AI."
تهدف استراتيجية العضوية هذه، التي تم الإعلان عنها لأول مرة في ديسمبر، إلى إنشاء نموذج جديد للإيرادات للشركة.
شراكة مع Fireworks لتعزيز أداء واجهة برمجة التطبيقات
ستعزز شراكة Stability AI مع Fireworks AI أداء واجهة برمجة التطبيقات لـ Stable Diffusion 3. يمكن أن يكون تحسين استدلال واجهة برمجة التطبيقات لتطبيقات الذكاء الاصطناعي التوليدي—خاصة على نطاق واسع—معقدًا، لكن خبرة Fireworks AI في مجمعات التعلم الآلي ستساعد في معالجة هذه التحديات.
أشار لافورتي: "تعتبر Fireworks AI من الخبراء الرائدين في مجمعات التعلم الآلي، وهو عنصر حيوي لتحسين سرعة استدلال نماذجنا." يسمح لنا التعاون معهم بتقديم أسرع وأحدث منصة واجهة برمجة تطبيقات على مستوى المؤسسات في السوق.
ابتكارات في Stable Diffusion 3
في جوهر Stable Diffusion يوجد نموذج الانتشار، مع العديد من الابتكارات التي تعزز من قدراته. ومن الجدير بالذكر أن إدخال بنية Multimodal Diffusion Transformer (MMDiT) يحسن فهم النصوص ودقة الطباعة.
بالنسبة لنموذج SD3-Turbo، الذي يقدم أداءً أسرع، يتم استخدام طريقة جديدة تُعرف باسم Latent Adversarial Diffusion Distillation (LADD). أوضح لافورتي: "في الأساس، يعمل SD3-Turbo بشكل أسرع حتى 10 مرات من SD3 بينما ينتج صورًا عالية الجودة تقريبًا."
تقديم Stable Assistant
بالإضافة إلى نموذج Stable Diffusion الجديد، كشفت Stability AI عن إصدار تجريبي مبكر من Stable Assistant، وهو روبوت محادثة مدعوم من تكنولوجيا توليد النصوص والصور الخاصة بالشركة. على غرار تكامل ChatGPT Plus من OpenAI مع DALL-E 3، يتيح Stable Assistant توليد الصور من خلال المحادثة.
وصف لافورتي Stable Assistant بأنه روبوت محادثة سهل الاستخدام يجمع بين قدرات Stable Diffusion 3 وStable LM 2 12B، الذي تم إصداره مؤخرًا. هذه الأداة لا تقتصر على توليد الصور من المناقشات بل تقدم أيضًا ردودًا معلوماتية، وتساعد في مشاريع الكتابة، وتعزز المحتوى بصور مناسبة.
قال لافورتي: "يهدف Stable Assistant إلى أن يصبح روبوت المحادثة متعدد الأوجه، مما يوفر الوصول إلى جميع نماذجنا وخدمات واجهة برمجة التطبيقات دون الحاجة إلى خبرة تقنية." وأضاف: "نخطط للاستمرار في تعزيز قدراته بإضافة تحرير الصور ودمج نماذج من مجالات أخرى، بما في ذلك الفيديو، ثلاثي الأبعاد، الصوت، والكود."