نموذج Google المتقدم لتحويل النص إلى صورة، Imagen 3، يُستعد لإطلاقه على منصة Vertex AI. ستتوفر هذه الأداة الذكية الجيل التالي لعملاء مختارين في مرحلة المعاينة، مقدمةً للمطورين تجربة أسرع في توليد الصور، وتحسين في فهم المطالبات، وصور أكثر واقعية للأشخاص، بالإضافة إلى تحسينات في عرض النص مقارنةً بالإصدارات السابقة.
تم تقديم Imagen 3 لأول مرة في حدث Google I/O في مايو، وبدأت رحلتها مع معاينة خاصة في ImageFX للمنشئين المختارين. أكدت Google في إعلانها أن هذا النموذج القوي سيكون متاحًا قريبًا عبر Vertex AI.
أكد دوغلاس إيك، مدير الأبحاث الكبير في Google DeepMind، على إمكانياته، قائلاً: "إنه نموذجنا الأكثر قدرة في توليد الصور حتى الآن. يعتبر Imagen 3 أكثر واقعية، ويحتوي على تفاصيل أغنى، ويقلل من العيوب البصرية. إنه يفهم المطالبات المصاغة بطريقة طبيعية وإبداعية، حيث تعطي التعليمات المفصلة أفضل النتائج. بالإضافة إلى ذلك، يتفوق في دمج التفاصيل الدقيقة من المطالبات الأطول ويحسن عرض النص، وهو تحدٍ مستمر في نماذج توليد الصور السابقة."
مع الانتقال إلى Vertex AI، يقدم Imagen 3 دعمًا لعدة لغات، وميزات أمان قوية مثل العلامة المائية الرقمية SynthID من Google DeepMind، ودعم لمختلف نسب العرض إلى الارتفاع.
شترستوك، الرائد في مجال التصوير الفوتوغرافي المخزني، قد دمجت هذا النموذج بالفعل. علق جاستين هيزا، نائب رئيس خدمات البيانات في شترستوك، قائلاً: "منذ دمج Imagen في مولد الصور الذكي لدينا، أنشأ مستخدمونا ملايين الصور. نحن متحمسون لتحسينات Imagen 3، مما يتيح للمستخدمين تنفيذ أفكارهم بسرعة أكبر دون المساس بالجودة. تعزز هذه التحسينات التزام شترستوك بتوليد صور ذكاء اصطناعي ذات مصادر أخلاقية، مع ضمان الأمان والحماية من خلال تعويض جوجل كلاود لتوليد الذكاء الاصطناعي."
بينما تواصل Google تطوير Imagen، لم تفصح بعد عن موعد استئناف Gemini AI لتوليد الصور بعد تعرضه للانتقادات بسبب عدم الدقة. خلال مؤتمر صحفي مؤخر، أوضح توماس كوريان، الرئيس التنفيذي لجوجل كلاود، الفرق بين النموذجين: "Gemini هو نموذج متعدد الوسائط مصمم لمعالجة أنواع متعددة من المدخلات، بما في ذلك الصور والفيديو والصوت، مما يمكنه من التفكير عبر هذه الوسائط. على النقيض، فإن Imagen هو نموذج تفاضلي يركز فقط على توليد مخرجات نص إلى صورة عالية الجودة. كل منهما يخدم غرضًا مختلفًا."
لا تزال الأسئلة حول الجدول الزمني لإعادة تمكين وظيفة الصور في Gemini بدون إجابة.