هل يمكن لجمل مكسو بالفرو أن يحصل على لقب أكبر قصة في مجال الذكاء الاصطناعي لعام 2023؟ إذا كنا نتحدث عن Llama، النموذج اللغوي الكبير الذي أنشأته Meta والذي أحدث ثورة في مجال أبحاث الذكاء الاصطناعي في فبراير، تلاه الإصدار التجاري Llama 2 في يوليو وCode Llama في أغسطس، فإنني أقول نعم.
يمكنني بالفعل سماع الانتقادات. "ماذا؟ ChatGPT هو بوضوح القصة الأكبر في الذكاء الاصطناعي لعام 2023!" أسمع الحشود تصرخ. "تم إطلاق ChatGPT من OpenAI في 30 نوفمبر 2022، وبلغ عدد مستخدميه 100 مليون في فبراير! لقد جعل الذكاء الاصطناعي التوليدي جزءًا من الثقافة الشعبية!"
ولكن دعني أوضح رؤيتي. في رأيي، يعد ChatGPT بلا شك نقطة تحول في الذكاء الاصطناعي التوليدي. كما أشار المحلل في Forrester، روان كيرنان، فهو "الشرارة التي أشعلت النار حول الذكاء الاصطناعي التوليدي".
ومع ذلك، فإن فبراير كان لحظة محورية حيث أصدرت Meta Llama، وهو أول نموذج لغوي كبير مجاني ومفتوح المصدر. وهذا أثار نقاشًا حادًا حول الذكاء الاصطناعي المفتوح المصدر استمر طوال العام. في حين قامت الشركات الكبرى الأخرى ومصنعي نماذج اللغة الكبيرة وصانعي السياسات بدراسة أمان نماذج الذكاء الاصطناعي ذات الوصول المفتوح، سارت عجلة الذكاء الاصطناعي المفتوح المصدر بخطا ثابتة.
وفقًا لـ Meta، منذ إطلاق Llama، قدمت مجتمع الذكاء الاصطناعي المفتوح المصدر أكثر من 7000 نموذج مشتق على منصة Hugging Face، مما أدى إلى ظهور نماذج بارزة مثل Koala وVicuna وAlpaca وDolly وRedPajama. ورغم وجود نماذج أخرى مفتوحة المصدر مثل Mistral وHugging Face وFalcon، إلا أن Llama كان الأول المدعوم ببيانات وموارد شركة تقنية كبرى.
يمكن مقارنة ChatGPT بفيلم باربي الضخم لعام 2023، بينما Llama ونظائره من النماذج المفتوحة تشبه عالم مارفل الواسع، مليء بالإصدارات الفرعية التي تعد بتأثير دائم على مجال الذكاء الاصطناعي.
ستقود هذه الاتجاهات إلى "تطبيقات حديثة وفعالة في الذكاء الاصطناعي التوليدي، مما يعزز أسس المفتوحة في هذا المجال"، كما قال كجيل كارلسون، رئيس استراتيجية علوم البيانات في Domino Data Lab.
التأثير طويل الأمد للذكاء الاصطناعي المفتوح المصدر
أعلن ChatGPT عن عصر النماذج المغلقة والملكية. OpenAI، التي تأسست في 2015 كمبادرة أبحاث مفتوحة، غيرت موقفها في 2023. حيث اعترف إيليا سوتسكيڤر، أحد مؤسسي OpenAI، لموقع The Verge بأن مشاركة الأبحاث كانت خطوة خطأ تحفزها المنافسة والمخاوف الأمنية.
في المقابل، دعا يان ليكون، كبير علماء الذكاء الاصطناعي في Meta، إلى الإصدار التجاري لـ Llama 2، مشددًا على أن النماذج اللغوية الكبيرة تمثل بنية تحتية حيوية يجب أن تظل مفتوحة. وأقر كارلسون بأن مقارنة ChatGPT وLlama تشبه مقارنة التفاح بالبرتقال، حيث يعد Llama 2 ثوريًا بطبيعته المفتوحة وترخيصه التجاري الذي يمكّن المستخدمين من التخصيص والعمل على نطاق واسع.
بينما اعترف بدور ChatGPT المحوري في جذب الانتباه العام نحو نماذج اللغة الكبيرة، أكد أن نماذجه الأساسية، GPT 3.5 و4، محدودة النطاق ويجب أن تستخدم بشكل رئيسي كدليل على الفكرة.
أشار مات شومر، الرئيس التنفيذي لشركة Otherside AI، إلى أن تأثير Llama يرجع في جزء كبير منه إلى القاعدة التي وضعها ChatGPT، قائلًا: "هناك المئات من الشركات التي تأسست في العام الماضي ولم يكن وجودها ممكنًا بدون Llama والتطورات اللاحقة."
وأشاد الرئيس التنفيذي السابق لشركة Neeva، سدھار راماسوامي، بـ Llama 2 كأول نموذج للذكاء الاصطناعي المفتوح المصدر القادر حقًا، مشيرًا إلى إمكانية هيمنة عدد قليل من الشركات على قدرات الذكاء الاصطناعي، لكن Meta جعلت Llama متاحة للجميع.
تسرب Llama المبكر ونتائجه
في فبراير، برز Llama بأحجام نماذجه المتنوعة، من 7 مليارات إلى 65 مليار معلمة. وأظهر نموذج Llama 13B أداءً أفضل من GPT-3 في العديد من مقاييس معالجة اللغة الطبيعية، فيما تنافس أكبر نموذج له مع النماذج الرائدة مثل PaLM وChinchilla. في البداية، قدمت Meta أوزان النماذج للباحثين الأكاديميين المختارين، بما في ذلك جامعة ستانفورد لمشروعها Alpaca.
بعد تسريب في 4chan، حصل المطورون حول العالم على وصول لنموذج LLM بمستوى GPT، مما أدى إلى زيادة كبيرة في النماذج المشتقة. في يوليو، جعلت Meta Llama 2 متاحًا مجانًا للاستخدام التجاري، مع دمجه في خدمة Azure السحابية من Microsoft.
كانت هذه اللحظة حاسمة حيث تصاعدت المناقشات حول تنظيم الذكاء الاصطناعي. في يونيو، أعرب بعض السيناتورات الأميركيين عن قلقهم بشأن تسرب Llama، مشيرين إلى استخدامها المحتمل في أنشطة ضارة متنوعة.
رغم هذه التحديات، أكدت Meta التزامها تجاه الذكاء الاصطناعي المفتوح المصدر. في اجتماع يونيو، شدد مارك زوكربيرغ على دمج الذكاء الاصطناعي التوليدي في جميع منتجات Meta وأكد من جديد على التزام الشركة بـ"نهج قائم على العلوم المفتوحة" في أبحاث الذكاء الاصطناعي.
Meta: راعية الأبحاث المفتوحة
دافعت Meta باستمرار عن الأبحاث المفتوحة، وحققت تقدمًا كبيرًا من خلال تعزيز بيئة حول إطار عمل PyTorch. مع اقتراب عام 2023 من نهايته، ستحتفل Meta بالذكرى السنوية العاشرة لمبادرة Fundamental AI Research (FAIR)، التي تهدف إلى تطوير الذكاء الاصطناعي من خلال الأبحاث المفتوحة لمصلحة العامة.
انضمت جويل بينو، نائب رئيس أبحاث الذكاء الاصطناعي في Meta، إلى المؤسسة في 2017 بسبب التزامها بالعلوم المفتوحة، وهو ما اعتبرته جزءًا من القيم الأساسية لـMeta. "السبب الذي دفعني للانضمام دون البحث في أماكن أخرى هو الالتزام بالعلوم المفتوحة"، انعكست قائلة.
ومع ذلك، لاحظت بينو تحولاً في دوافع الأبحاث المفتوحة. بينما كانت الأهداف الأولية تركز على تحسين جودة البحث، فإن التطورات الأخيرة قد حفزت الإنتاجية بشكل كبير في نظام الذكاء الاصطناعي، مما يمكّن العديد من الشركات الناشئة من الاستفادة من نماذج بديلة.
لكنها حذرت من أن Meta لا تضمن دائمًا إصدارات مفتوحة. كل مشروع يخضع لتحليل دقيق للمخاطر والفوائد.
تفكير حول Llama: الدقة أهم من الكمال
وأكدت آنجلا فان، عالمة الأبحاث في META FAIR والمشاركة في تطوير نماذج Llama، على الأسس الفعالة التي ساهمت في إنشاء نماذج Llama. "رغم أن التكنولوجيا لا تزال تتطور، يمكننا خلق أدوات مثيرة وتطوير تكامل ثابت عبر تطبيقاتنا"، قالت.
تسعى Meta للحصول على تعليقات مستمرة من مجتمع المطورين لديها والشركات الناشئة التي تستخدم Llama في تطبيقات متنوعة، بهدف تحسين الإصدارات المستقبلية.
وقالت فان إن الدقة والإعداد الدقيق كانا أساسياً في تطوير Llama. الأمر لا يتعلق بالإبداعات الكبرى فحسب، بل بتنفيذ العديد من المهام الصغيرة بفاعلية على مدار الوقت.
الدفاع عن الذكاء الاصطناعي المفتوح المصدر
توافقت فيبول فيد بركش، المؤسس المشارك لشركة Together – التي تُعرف بإنشاء مجموعة بيانات RedPajama – على أن Llama والذكاء الاصطناعي المفتوح هما المحوران الرئيسيان لعام 2023. من خلال تطوير نماذج عالية الجودة داخل شبكة واسعة من الشركات، تتوزع التكاليف بفعالية، مما يساعد الشركات الناشئة في تقليل مصاريف بناء النماذج.
ومع ذلك، مع بدء المسؤولين في التدقيق في الذكاء الاصطناعي المفتوح، يؤكد المدافعون على ضرورة حماية الوصول إلى هذه النماذج. خلال قمة الأمان الأخيرة في المملكة المتحدة، كانت المخاوف بشأن مخاطر أنظمة الذكاء الاصطناعي المتقدمة بارزة.
رغم هذه المخاوف، أصدرت مجموعة من مؤيدي الذكاء الاصطناعي المفتوح، بما في ذلك ليكون ومؤسس Google Brain أندرو نغ، بيانًا يؤكد أن الذكاء الاصطناعي المفتوح هو "ترياق، وليس سمًا".
النقاش المستمر: Llama مقابل ChatGPT
يستمر النقاش حول Llama وChatGPT في إشعال المناقشات بين الخبراء. في حين يعتقد البعض أن ChatGPT هو القصة المهيمنة للأعوام، يرى الآخرون أن تأثير Llama يمثل تمهيدًا لتغييرات تحويلية في الذكاء الاصطناعي.
أصر نيكولاوس فاسيولوجلو، نائب رئيس أبحاث ML في RelationalAI، "بلا أدنى شك، ChatGPT هو نقطة تحول"، بفضل كفاءته الهندسية والعملياتية. وأكد جون ليوتييه، الرئيس التنفيذي لشركة TravelAI، هذا الشعور، موضحًا دور ChatGPT في جعل الذكاء الاصطناعي متاحًا للمستخدمين العاديين.
في المقابل، أشار بن جيمس، الرئيس التنفيذي لشركة Atlas، إلى أن Llama revitalizت الأبحاث والابتكار بطريقة لم يفعلها ChatGPT، مقترحًا تأثيرات طويلة الأمد.
في النهاية، ساهمت كلا النموذجين بشكل كبير في مشهد الذكاء الاصطناعي. بينما أطلق ChatGPT اهتمامًا واسع النطاق في الذكاء الاصطناعي التوليدي، يبدو أن Llama مستعدة لتشكيل تأثيرها المستقبلي. كما صرّح كيرنان، فإن ظاهرة الذكاء الاصطناعي التوليدي في 2023 لم تكن لتحدث لولا ChatGPT، لكن الدافع نحو التطبيقات المبتكرة سيستمد قوته بشكل كبير من المجتمع المفتوح المصدر.
على المدى الطويل، ستتعايش النماذج المغلقة والمفتوحة المصدر. ومع ذلك، فإن غياب نماذج مفتوحة مثل Llama 2 – التي اعتمدها المطورون في المؤسسات على نطاق واسع – سيجعل عالم الذكاء الاصطناعي التوليدي أقل تطورًا وأكثر تخصصًا. يلعب المجتمع المفتوح المصدر دورًا حاسمًا في تحقيق تقدمات طويلة الأمد في هذا المجال المثير.