تعمل Google على تعزيز دردشة Bard AI لمنافسة ChatGPT من OpenAI بشكل أقوى. تحت إشراف سوندار بيتشاي، أعلنت Google عن إضافة ميزات توليد الصور عبر نموذجها الخاص Imagen 2، بالإضافة إلى إصدار أكثر تقدمًا من Gemini Pro.
تتيح هذه التحديثات للمستخدمين الوصول الواسع لوظائف Bard الذكية، بما في ذلك أداة جديدة مجانية لإنشاء صور مولدة بواسطة الذكاء الاصطناعي. وقال جاك كراوتشيك، قائد المنتج في Bard، في منشور بالمدونة: "تضع هذه التحديثات Bard كشريك ذكاء اصطناعي أكثر كفاءة وقابلية للوصول عالميًا، من المشاريع الإبداعية الكبيرة إلى الأنشطة اليومية".
بالإضافة إلى ذلك، بدأت Google اليوم في اختبار مولد صور آخر يسمى ImageFX.
نموذج Gemini Pro مع دعم اللغات المتعددة:
قبل أكثر من شهر، قدمت Google نموذج Gemini AI بثلاث نسخ: Nano للاستخدام على الهواتف المحمولة، وPro للتطبيقات المتوسطة، وUltra، الذي من المتوقع أن يكون أقوى نموذج لغوي تم إنشاؤه على الإطلاق—أكثر تطورًا من GPT-4—على الرغم من أن إصدار Ultra لن يتم حتى وقت لاحق من هذا العام.
أظهرت المقارنات الأولية بين Gemini Pro ونماذج أخرى أنه قد يتخلف عن النموذج السابق GPT-3.5 Turbo من OpenAI. هذا يشكل تحديًا لـ Google حيث تسعى لإظهار إمكانياتها في سوق الذكاء الاصطناعي التوليدي. تم إصدار نسخة معدلة من Gemini Pro على Bard الشهر الماضي، لكنها كانت متاحة فقط باللغة الإنجليزية.
تهدف سلسلة الميزات الجديدة اليوم إلى مساعدة Google في سد هذه الفجوة. سيدعم الإصدار الأخير من Bard أكثر من 40 لغة—including الكورية، الإسبانية، التاميلية، الإيطالية، والروسية—في أكثر من 230 دولة ومنطقة. يتيح هذا التوسع مزيدًا من المستخدمين الوصول إلى قدرات Gemini Pro المتقدمة في الفهم والتلخيص والمنطق والترميز، إلى جانب ميزة Bard التي تتحقق من الإجابات من خلال البحث في الويب.
توليد الصور باستخدام Imagen 2: منافسة ChatGPT Plus وDALL-E 3
ربما يكون التطور الأكثر إثارة هو تقديم توليد الصور باستخدام نموذج Imagen 2، والذي صُمم لإنشاء صور فوتوغرافية عالية الجودة من النصوص. هذا يعزز من وضع Bard كمنافس مباشر لـ ChatGPT Plus من OpenAI، الذي يدمج مولد الصور DALL-E 3.
وأوضح كراوتشيك: "ببساطة، وصف ما تريده—مثل ‘أنشئ صورة لكلب يركب لوح التزلج’—وسيولد Bard مجموعة متنوعة من المرئيات للحياة مفهومك".
خلال الاختبار، أنتج Bard الصور في حوالي 30-40 ثانية، مما يظهر تنسيقًا جيدًا. ومع ذلك، كانت هناك حالات لم يتمكن فيها من إنشاء صور على الإطلاق، حتى عند الالتزام بالإرشادات التي تستثني الصور المتعلقة بالأشخاص المعروفين لتفادي الفضائح المحتملة.
حاليًا، لا يوجد دعم لتغيير نسبة العرض إلى الارتفاع أو استخدام النصوص غير الإنجليزية، بناءً على اختباراتنا الأولية للأداة.
لمعالجة مخاوف حقوق النشر المتعلقة بالوسائط المولدة بواسطة الذكاء الاصطناعي، يسمح Google Bard للمستخدمين بالإبلاغ عن القضايا القانونية المتعلقة بحماية البيانات وحقوق النشر لكل المحتوى المولد. كما تفرض المنصة حدودًا على المحتوى العنيف أو المسيء أو الجنسي. علاوة على ذلك، أدخلت Google علامات مائية رقمية يمكن التعرف عليها في بيكسلات الصور المولدة باستخدام SynthID التي طورتها DeepMind، مما يساعد على تمييز المرئيات المولدة بواسطة الذكاء الاصطناعي عن تلك التي أنشأها الفنانون البشريون.
ميزات جديدة مع ImageFX
بالإضافة إلى Bard، تستكشف Google أيضًا ImageFX، المدعومة بواسطة Imagen 2. تتوفر الآن في AI Test Kitchen، التطبيق التجريبي لـ Google، تشجع ImageFX الاستكشاف الإبداعي من خلال "شذرات تعبيرية" تقدم للمستخدمين اقتراحات وأبعاد إضافية لتعزيز نصوصهم. هذه الميزة مشابهة لما هو موجود في أدوات إبداعية أخرى، مثل Ideogram.
يستضيف AI Test Kitchen أيضًا مشاريع مبتكرة مثل MusicFX، التي يمكنها إنشاء ألحان تصل إلى 70 ثانية باستخدام النصوص والشذرات التعبيرية، بالإضافة إلى TextFX، الموجهة للكتّاب والشعراء.