سيلزفورس تطلق نماذج الذكاء الاصطناعي متعددة الأنماط 'xGen-MM' مفتوحة المصدر لتعزيز فهم اللغة المرئية.

قدمت Salesforce، الرائدة في برمجيات الشركات، مجموعة جديدة من نماذج الذكاء الاصطناعي الكبيرة المفتوحة المصدر متعددة الوسائط، المعروفة باسم xGen-MM (أو BLIP-3). من المتوقع أن يساهم هذا الإصدار المبتكر في تسريع التطورات في أنظمة الذكاء الاصطناعي المتقدمة.

تفصيل إطار xGen-MM، كما ورد في ورقة بحثية نُشرت على arXiv من قبل باحثين في Salesforce AI Research، يتكون من نماذج مدربة مسبقًا ومجموعات بيانات شاملة ورمز لضبط الأداء. النموذج الأكبر يحتوي على 4 مليارات معلمة ويظهر أداءً تنافسيًا عبر مقاييس متعددة مقارنة بالنماذج المماثلة المفتوحة المصدر.

يقول المؤلفون: "نقوم بفتح نماذجنا، ومجموعات البيانات الكبيرة المنسقة، وقاعدة التعليمات البرمجية لدينا لتسهيل المزيد من التقدم في أبحاث LMM". تشير هذه المبادرة إلى تحول بعيدًا عن نماذج الملكية، مما قد يؤدي إلى نشر الوصول إلى تكنولوجيا الذكاء الاصطناعي المتقدمة.

توضح رسم بياني هيكلي لإطار xGen-MM (BLIP-3) كيفية معالجة النموذج للبيانات المترابطة بين الصور والنصوص. يستخدم النموذج مُحوِّل الرؤية لترميز الصور، وعينة الرموز لضغط المعلومات البصرية، ونموذج لغة مدرب مسبقًا لتوليد النصوص، مع تطبيق خسائر ذات صلة على الرموز النصية.

تعتبر قدرة xGen-MM على إدارة "البيانات المترابطة" التي تجمع بين صور متعددة ونصوص أحد مفاتيح ابتكاره، حيث تُرى هذه القدرة من قبل الباحثين على أنها "أكثر أشكال البيانات متعددة الوسائط طبيعية". هذه المهارة تسمح للنماذج بأداء مهام معقدة، مثل الإجابة على أسئلة حول صور عديدة في وقت واحد، مما يجعلها ذات قيمة في مجالات متنوعة مثل التشخيص الطبي والمركبات المستقلة.

يتضمن الإصدار عدة نماذج متباينة مُحسَّنة لمهام معينة: نموذج أساسي مدرب مسبقًا، نسخة "معدلة بالتعليمات" للإلتزام بالتوجيهات، ونموذج "معدل للأمان" يهدف إلى تقليل المخرجات الضارة. تعكس هذه الاختيارات التعرف المتزايد في مجتمع الذكاء الاصطناعي على الحاجة لدمج القدرات مع الاعتبارات الأخلاقية.

يعد قرار Salesforce بفتح هذه النماذج وعدًا كبيرًا لتعزيز الابتكار في مجال الذكاء الاصطناعي متعدد الوسائط. من خلال منح الباحثين والمطورين الوصول إلى نماذج ومجموعات بيانات عالية الجودة، تخلق Salesforce فرصًا لتعاون أوسع وتقدم، في تباين مع استراتيجيات الانغلاق لبعض عمالقة التكنولوجيا.

ومع ذلك، فإن إطلاق مثل هذه النماذج المؤثرة يثير أسئلة حرجة حول المخاطر المحتملة والتأثيرات الاجتماعية المرتبطة بأنظمة الذكاء الاصطناعي المتقدمة. على الرغم من أن Salesforce قد أدخلت تحسينات للأمان لمعالجة هذه المخاوف، فإن التداعيات الأوسع للنماذج المتقدمة القابلة للوصول لا تزال تحفز المناقشات داخل مجتمع التكنولوجيا وما وراءه.

تم تدريب نماذج xGen-MM على مجموعات بيانات موسعة منسقة بواسطة Salesforce، بما في ذلك مجموعة بيانات تضم تريليون رمز من البيانات المترابطة بين النصوص والصور تعرف باسم "MINT-1T". بالإضافة إلى ذلك، تم تطوير مجموعات بيانات جديدة تستهدف التعرف على النصوص البصرية والأسس البصرية، وهي ضرورية لتفاعل أنظمة الذكاء الاصطناعي بشكل طبيعي مع البيئة البصرية.

مع تزايد انتشار تكنولوجيا الذكاء الاصطناعي، يزود مبادرة Salesforce المفتوحة المصدر الباحثين بالأدوات الحيوية لتعزيز فهمهم وتطويرهم لهذه الأنظمة القوية. كما يضع هذا التحرك معيارًا للشفافية في مجال غالبًا ما ينقد لافتقاره إليها، مما قد يشجع شركات التكنولوجيا الأخرى على اعتماد ممارسات مماثلة في أبحاثها في مجال الذكاء الاصطناعي.

في سباق الذكاء الاصطناعي المتزايد، قد تشكل الاستراتيجية المفتوحة لـ Salesforce عاملاً مميزًا حيويًا. من خلال تعزيز بيئة تعاونية حول نماذجها، قد تعزز الشركة الابتكار الأسرع وت cultivar العلاقات الإيجابية داخل مجتمع البحث. ومع ذلك، لا يزال يتعين رؤية فعالية هذه الاستراتيجية في المجال التنافسي لحلول الذكاء الاصطناعي المؤسسية.

الكود والنماذج ومجموعات البيانات لـ xGen-MM متاحة على مستودع GitHub الخاص بشركة Salesforce، مع توقع موارد إضافية على موقع المشروع قريبًا. مع تفاعل الباحثين والمطورين مع هذه النماذج، ستتكشف التداعيات الحقيقية لمساهمات Salesforce في الذكاء الاصطناعي متعدد الوسائط بشكل متزايد في الأشهر والسنوات القادمة.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles