استكشف Pixtral 12B: الذكاء الاصطناعي المتعدد الوسائط المبتكر من Mistral لتحليل الصور بلا حدود

تقدم شركة Mistral AI نفسها في مجال الذكاء الاصطناعي متعدد الوسائط مع إطلاق نموذج Pixtral 12B، وهو الأول من نوعه من هذه الشركة الناشئة الفرنسية، الذي يدمج بين معالجة اللغة والرؤية. هذا التطور يعزز مكانة Mistral لتنافس عمالقة الصناعة مثل OpenAI وAnthropic.

حالياً، لا يتوفر Pixtral 12B على الويب العام، ولكن المطورين يمكنهم تحميل كوده المصدري من Hugging Face أو GitHub لاختباراته الفردية. وكسرًا للبروتوكولات المعتادة للإصدارات في الذكاء الاصطناعي، قامت Mistral بمشاركة رابط تورنت لتحميل ملفات النموذج.

أعلنت صوفيا يانغ، رئيسة علاقات المطورين، عبر منشور على X أن النموذج سيتاح قريبًا من خلال دردشة الويب الخاصة بـ Mistral، مما يتيح للمطورين تجربة ميزاته. بالإضافة إلى ذلك، سيتم دمجه في La Platforme الخاصة بـ Mistral، لتوفير نقاط وصول API للوصول إلى نماذج الشركة.

ما الذي يقدمه Pixtral 12B؟

بينما تبقى تفاصيل بيانات تدريبه غير معلنة، يهدف Pixtral 12B إلى تسهيل تحليل الصور بالتزامن مع نصوص. يجب أن يتمكن المستخدمون من رفع الصور أو تقديم روابط وطرح أسئلة تتعلق بالمحتوى.

على الرغم من أنه النموذج الأول متعدد الوسائط لشركة Mistral، فمن المهم ملاحظة أن المنافسين مثل OpenAI وAnthropic يمتلكون قدرات مشابهة. عند سؤالها عن الميزات الفريدة لـ Pixtral، أشارت يانغ إلى أنه يمكنه معالجة عدد غير محدود من الصور بأحجام مختلفة.

المختبرون الأوائل على X لاحظوا أن النموذج بحجم 24 جيجابايت يتمتع بهندسة قوية، تتضمن 40 طبقة و14,336 بعدًا مخفيًا و32 رأسًا من الانتباه لتحسين معالجة الحسابات. يدعم وحدة معالجة الرؤية الصور بدقة تصل إلى 1024×1024 ويتضمن 24 طبقة مخفية لتحليلات متقدمة للصور.

بينما تتحضر Mistral لإصدار النموذج عبر API، ستتضح إمكانياته في تطبيقات الرؤية مثل تحليل المحتوى والبيانات. لا يزال الأداء الدقيق لهذا النموذج المفتوح غير محدد، لكنه يرمز إلى الطموحات الكبيرة لـ Mistral في مجال الذكاء الاصطناعي.

منذ تأسيسها العام الماضي، طورت Mistral بسرعة مجموعة من النماذج لتحدي الرواد في الصناعة مثل OpenAI. كما أقامت شراكات استراتيجية مع شركات كبرى مثل Microsoft وAWS وSnowflake لتمديد نطاق تقنياتها. مؤخرًا، جمعت Mistral 640 مليون دولار بتقييم بلغ 6 مليارات دولار وأطلقت Mistral Large 2، وهو نموذج بمستوى GPT-4 يتميز بقدرات متعددة اللغات وتحسين في التفكير، وتوليد الشيفرات، والأداء الرياضي.

علاوة على ذلك، أطلقت الشركة نموذج Mixtral، والذي يعتمد على مزيج من الخبراء، بالإضافة إلى Codestral، وهو نموذج للتشفير بوزن مفتوح يحتوي على 22 مليار بارامتر، إلى جانب نموذج مصمم للتفكير الرياضي والاكتشاف العلمي.

Most people like

Find AI tools in YBX