يؤكد الخبراء في مجالي الإعلام والتكنولوجيا أن نماذج اللغة الكبيرة مفتوحة المصدر يمكن أن تؤثر بشكل كبير على الذكاء الاصطناعي التوليدي في المؤسسات، ربما أكثر من النماذج المملوكة مثل ChatGPT من OpenAI أو منتجات Anthropic.
على الرغم من التجارب الواسعة والعديد من المشاريع التجريبية مع النماذج مفتوحة المصدر، تأخرت الشركات الراسخة في الكشف عن تطبيقاتها الواقعية. لهذا الغرض، تواصلنا مع مقدمي نماذج LLM مفتوحة المصدر الرئيسيين مثل Meta وMistral AI وIBM وHugging Face وDell وDatabricks وAWS وMicrosoft.
كشفت استفساراتنا عن 16 حالة نشر بارزة (انظر القائمة أدناه). ورغم أن هذا العدد متواضع، يتوقع المحللون في صناعة الذكاء الاصطناعي ارتفاعًا في التطبيقات مفتوحة المصدر بنهاية هذا العام.
تأخير في اعتماد النماذج مفتوحة المصدر
أحد أسباب بطء اعتماد النماذج مفتوحة المصدر هو تاريخها القصير. أطلقت Meta أول نموذج مفتوح المصدر كبير، Llama، في فبراير 2023، بعد ثلاثة أشهر من إصدار OpenAI لـ ChatGPT في نوفمبر 2022. نموذج Mixtral من Mistral AI، الذي حظي بمديح في معايير متعددة، تم إصداره منذ شهر فقط، مما يعني أن عمليات النشر الواقعية بدأت للتو.
يعترف المدافعون عن النماذج مفتوحة المصدر بأن النماذج المغلقة ما زالت تفوقها في الانتشار، لكنهم يتوقعون تضييق الفجوة.
تحديات النماذج مفتوحة المصدر
توجد قيود على النماذج مفتوحة المصدر الحالية. أشار عمجد مسعد، الرئيس التنفيذي لشركة Replit، إلى أن آلية التغذية الراجعة لتطوير النماذج غير فعالة بسبب صعوبة المساهمة في تحسينات. ومع ذلك، قد يبالغ البعض في تقدير مدى التجربة التي يجريها المطورون مفتوحو المصدر، الذين أنشأوا آلاف النماذج المشتقة — بعضها تظهر أداءً متساويًا أو أفضل مقارنة بالنماذج المغلقة في مهام معينة، مثل FinGPT وBioBert.
القيمة المحدودة للنماذج العامة الكبيرة للشركات
وفقًا لمات بيكر، نائب رئيس استراتيجية الذكاء الاصطناعي في Dell، "تمتلك النماذج العامة الكبيرة قيمة قليلة أو معدومة للشركات الخاصة". أوضح بيكر أن هذه النماذج غالبًا ما تكون مُعممة بشكل مفرط ولا تسهل إدماج بيانات المؤسسات الخاصة، التي تمثل حوالي 95% من العمل الذي تقوم به المنظمات في مجال الذكاء الاصطناعي.
لذا، تبحث العديد من المؤسسات عن حلول مفتوحة المصدر لدعم العملاء وتوليد الأكواد، باستخدام أكواد مخصصة غالبًا ما تكون غير متوافقة مع نماذج LLM المغلقة.
الحركة البطيئة بسبب اعتبارات المؤسسات
أشار أندرو جاردين من Hugging Face إلى أن المؤسسات غالبًا ما تتردد في اعتماد تطبيقات LLM لأنها تعطي الأولوية لخصوصية البيانات وتجربة العملاء والأبعاد الأخلاقية. عادة، تقوم الشركات بتجربة الحالات الاستخدام الداخلية قبل التوسع إلى التطبيقات الخارجية. في حين شهدت النماذج المغلقة انتشارًا كبيرًا في نهاية عام 2023، يُتوقع تسريع تنفيذ النماذج مفتوحة المصدر هذا العام.
على الرغم من الفوائد، تجد بعض المؤسسات النماذج مفتوحة المصدر محيرة، حيث يتم العمل مع APIs المعروفة من مقدمي مثل OpenAI بشكل أبسط من إدارة قضايا الترخيص والحكومة مفتوحة المصدر.
تقليص الفجوة بين النماذج المفتوحة والمغلقة
وشدد جاردين على أن الفجوة بين النماذج المفتوحة والمغلقة أصبحت مشوشة بشكل متزايد. على سبيل المثال، تستخدم العديد من الشركات، بما في ذلك إحدى الشركات الكبرى في مجال الأدوية، نموذج LLM مغلق للمهام الداخلية ونموذج مفتوح المصدر لوظائف محددة مثل التعرف على المعلومات الحساسة. تعكس هذه الاختيار رغبة في تحقيق تحكم أكبر في البيانات.
الحجة لتبني النماذج مفتوحة المصدر
مع التغير السريع في عوامل التكيف مع النماذج والتكاليف، من المحتمل أن تسعى الشركات إلى المرونة في التبديل بين النماذج مفتوحة المصدر والمغلقة لتقليل المخاطر. تميل الشركات غالبًا نحو النماذج مفتوحة المصدر للحفاظ على السيطرة على البيانات الحساسة بينما تقوم بضبطها لاستخدامات متخصصة.
تقوم عدة شركات، مثل Intuit وPerplexity، بتطوير طبقات تنسيق الذكاء الاصطناعي التوليدية التي تسمح بالتكامل السلس لمختلف النماذج للمهام المحددة، بغض النظر عن حالتها المفتوحة أو المغلقة. على الرغم من أن نشر النماذج مفتوحة المصدر على نطاق واسع قد يتطلب مزيدًا من الجهد، إلا أنها يمكن أن توفر وفورات في التكاليف على المدى الطويل، خاصةً للمنظمات التي لديها بنية تحتية قائمة.
تستفيد العديد من المؤسسات بصمت من النماذج مفتوحة المصدر. على سبيل المثال، تقوم شركات السيارات والخطوط الجوية بتجربة التطبيقات التي تعمل على منصة Databricks lakehouse، والتي تشمل نماذج LLM مفتوحة المصدر.
تحديات تحديد عمليات النشر مفتوحة المصدر
يمكن أن يكون من الصعب تحديد حالات الاستخدام النمطية. بينما يقوم العديد من المطورين والشركات الناشئة بإنشاء تطبيقات باستخدام نماذج LLM مفتوحة المصدر، نسعى لتسليط الضوء على الشركات الراسخة ذات التطبيقات المتميزة. قمنا بتعريف المؤسسة بوصفها كيانًا له 100 موظف على الأقل وركزنا على المستخدمين النهائيين بدلاً من مزودي تكنولوجيا LLM.
يتمثل التحدي في تعريف "مفتوح المصدر"، كما يتضح من نموذج Meta Llama، الذي يمتلك ترخيصًا مقيدًا. علاوة على ذلك، بينما طورت شركات مثل Writer نماذج LLM خاصة بها، فإن فقط بعض النماذج مفتوحة المصدر، مما يجعل التصنيف أكثر تعقيدًا.
فيما يلي بعض أمثلة عمليات نشر المؤسسات المعتمدة على نماذج LLM مفتوحة المصدر:
1. VMWare: تستخدم نموذج Hugging Face StarCoder لتعزيز توليد الأكواد في بيئة مستضافة ذاتيًا، مما يضمن أمان الأكواد الملكية.
2. Brave: يستخدم المتصفح الذي يركز على الخصوصية نموذج Mixtral 8x7B لمدير المحادثات الخاص به، ليو.
3. Gab Wireless: تقوم بتطبيق نماذج Hugging Face لفحص الرسائل من أجل سلامة الأطفال، حظر المحتوى غير المناسب.
4. Wells Fargo: تستخدم نموذج Llama 2 من Meta لمجموعة متنوعة من التطبيقات الداخلية، مما يعزز موارد الموظفين.
5. IBM: تدمج نماذج LLM مفتوحة المصدر في تطبيق AskHR، الذي يساعد الموظفين في الاستفسارات المتعلقة بالموارد البشرية ويستخدم أيضًا في خدمات استشارية جديدة.
6. جوائز جرامي: تتعاون مع IBM في "قصص الذكاء الاصطناعي"، باستخدام Llama 2 لتوليد محتوى ورؤى مخصصة للجماهير.
7-9. دورة الأساتذة، بطولة ويمبلدون، بطولة الولايات المتحدة المفتوحة: تستفيد من تقنية IBM للتعليق المباشر وتوليد النقاط البارزة خلال الفعاليات.
10. Perplexity: شركة ناشئة تركز على إعادة ابتكار البحث، تستخدم نماذج LLM مفتوحة المصدر لتلخيص الردود في محرك بحثها.
11. CyberAgent: توظف نماذج LLM مفتوحة المصدر من Dell لنمذجة اللغة اليابانية وفقًا لاحتياجات المستخدمين.
12. Intuit: تجمع نماذجها الخاصة مع النماذج مفتوحة المصدر لتعزيز ميزات Intuit Assist.
13. Walmart: تطور تطبيقات الذكاء الاصطناعي التفاعلية، بعد أن استخدمت في البداية نموذج BERT مفتوح المصدر من Google.
14. Shopify: تقوم بتطبيق Llama 2 في Sidekick، أداة الذكاء الاصطناعي التي تسهل المهام لأصحاب الأعمال في التجارة الإلكترونية.
15. LyRise: شركة ناشئة في مجال توظيف المواهب أنشأت روبوت محادثة للتوظيف، باستخدام Llama في التفاعلات.
16. Niantic: تستخدم Llama 2 لتحريك تفاعلات الشخصيات في اللعبة المحمولة Peridot.
على الرغم من التحديات القائمة في تحديد وتتبع هذه العمليات، فإن الاهتمام بنماذج LLM مفتوحة المصدر يتزايد. مع استكشاف المزيد من الشركات لإمكاناتها، نتوقع أن يزداد عدد حالات الاستخدام العامة. سنستمر في تحديث هذه القائمة مع ظهور معلومات جديدة.