ت debut لاما 3.2 من ميتا: تهدف للتنافس مع OpenAI و Anthropic

لاما 3.2 من ميتا: عصر جديد في الذكاء الاصطناعي متعدد الوسائط

أعلنت ميتا اليوم في مؤتمر ميتا كونكت عن إطلاق لاما 3.2، وهو أول نموذج رؤية رئيسي للشركة يجمع بين فهم الصور والنصوص.

يتميز لاما 3.2 بنماذج صغيرة ومتوسطة الحجم (بـ 11 مليار و90 مليار معلمة) ونماذج خفيفة الوزن مخصصة للنصوص فقط (بـ 1 مليار و3 مليار معلمة) محسّنة للأجهزة المحمولة والأجهزة الطرفية.

قال مارك زوكربيرغ، الرئيس التنفيذي لشركة ميتا، خلال كلمته: "هذا هو أول نموذج مفتوح المصدر متعدد الوسائط لدينا. سيمكن تطبيقات متنوعة تتطلب فهم المرئيات."

مثل سابقتها، يوفر لاما 3.2 طول سياق واسع يصل إلى 128,000 توكن، مما يسمح بإدخال نصوص كبيرة تعادل مئات الصفحات من الكتب الدراسية. عادةً ما تعزز الأعداد الأكبر من المعلمات دقة النموذج وقدرته على التعامل مع المهام المعقدة.

كما قدمت ميتا توزيعاً رسمياً لمجموعة لاما اليوم، مما يتيح للمطورين الاستفادة من هذه النماذج في بيئات مختلفة، بما في ذلك الأنظمة المحلية، وعلى الأجهزة، والسحابية، وإعدادات النود الواحدة.

وأضاف زوكربيرغ: "المصدر المفتوح هو – وسيظل – الخيار الأكثر فعالية من حيث التكلفة، والقابل للتخصيص، والموثوق المتاح. لقد وصلنا إلى نقطة تحول في الصناعة؛ إنها تصبح معياراً، مثل نظام لينكس في مجال الذكاء الاصطناعي."

منافسة مع كلود وGPT-4o

بعد شهرين فقط من إطلاق لاما 3.1، أفادت ميتا بنمو قدره عشرة أضعاف في قدراتها.

وأشار زوكربيرغ: "يستمر لاما في التقدم بسرعة. إنه يفتح مجموعة متزايدة من الوظائف."

النماذج الأكبر في لاما 3.2 (11 مليار و90 مليار) تدعم الآن إمكانية استخدام الصور، مما يمكنها من تفسير الرسوم البيانية، وإنشاء تسميات توضيحية للصور، وتحديد الكائنات من العبارات اللغوية الطبيعية. على سبيل المثال، يمكن للمستخدمين الاستفسار عن شهر الذروة في مبيعات شركتهم، ويمكن للنموذج استنتاج الجواب باستخدام الرسوم البيانية المتاحة. ويمكن للنماذج الأكبر استخراج المعلومات من الصور لإنشاء تسميات تفصيلية.

تسهل النماذج الخفيفة تطوير تطبيقات مخصصة للاستخدام الخاص، مثل تلخيص الاتصالات الحديثة أو إدارة دعوات التقويم للمتابعات.

تؤكد ميتا أن لاما 3.2 تنافس كلود 3 هايكو من أنثروبك وGPT-4o-mini من أوبن أي في مهام التعرف على الصور والفهم البصري. ومن الجدير بالذكر أنها تتفوق على المنافسين مثل جيمّا وPhi 3.5-mini في اتباع التعليمات، والتلخيص، واستخدام الأدوات، وإعادة كتابة العبارات.

نماذج لاما 3.2 متاحة للتنزيل على llama.com، Hugging Face، وعبر منصات ميتا الشريكة.

توسيع ميزات الذكاء الاصطناعي للأعمال وتجربة المستهلك

تعمل ميتا أيضاً على تعزيز الذكاء الاصطناعي الخاص بالأعمال، مما يمكن الشركات من استخدام إعلانات الرسائل الفورية على واتساب ومسنجر. وهذا يشمل تطوير وكلاء قادرين على الرد على الاستفسارات الشائعة، ومناقشة تفاصيل المنتجات، وإتمام المشتريات.

أفادت الشركة أن أكثر من 1 مليون مُعلن يستخدمون أدواتها للذكاء الاصطناعي التوليدي، مما أسفر عن إنشاء 15 مليون إعلان في الشهر الماضي. في المتوسط، تشهد الحملات الإعلانية التي تستخدم الذكاء الاصطناعي التوليدي من ميتا زيادة بنسبة 11% في معدلات النقر و7.6% في معدلات التحويل.

بالنسبة للمستهلكين، يكتسب ذكاء ميتا "صوتاً"، مع العديد من أصوات المشاهير، بما في ذلك ديمي جودي دينش، وجون سينا، وكيغان-مايكل كي، وكريستين بيل، وأوكافينا.

قال زوكربيرغ: "أعتقد أن الصوت سيكون وسيلة أكثر طبيعية للتفاعل مع الذكاء الاصطناعي مقارنة بالنص. إنها أفضل بكثير."

يمكن للنموذج الاستجابة للأوامر الصوتية أو النصية بأصوات المشاهير عبر منصات مثل واتساب، ومسنجر، وفيسبوك، وإنستجرام. سيتفاعل ذكاء ميتا أيضاً مع الصور المشتركة، مع إمكانية تحرير الصور عن طريق إضافة أو تعديل الخلفيات. بالإضافة إلى ذلك، تexperiment ميتا أدوات جديدة للترجمة، ودبلجة الفيديو، ومزامنة الشفاه لذكاء ميتا.

أكد زوكربيرغ أن ذكاء ميتا مُقرر ليصبح المساعد الأكثر استخداماً على مستوى العالم، قائلاً: "ربما يكون قد وصل هناك بالفعل."

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles