خلال الاختبارات الأخيرة، أظهر نموذج اللغة الكبير (LLM) الجديد وعيًا بعملية تقييمه، مما يشير إلى احتمال وجود ميتا-معرفة—فهم لعملياته الفكرية. وقد أثار ذلك نقاشات حول الوعي الذاتي للذكاء الاصطناعي. ومع ذلك، تظل النقطة الأساسية هي القدرات المثيرة للإعجاب للنموذج، التي تعكس التقدم الذي شهدته نماذج اللغة الكبيرة المتزايدة في الحجم.
مع نمو نماذج اللغة الكبيرة، تزداد قدراتها الناشئة وتكاليف تطويرها. تصل تكاليف التدريب للنماذج الرائدة حاليًا إلى حوالي 200 مليون دولار، مما يثير القلق بشأن إمكانية الوصول إلى هذه الصناعة في المستقبل. تمامًا كما في صناعة أشباه الموصلات، حيث يمكن لعدد قليل فقط من الشركات تحمل تكلفة إنشاء مصانع تصنيع شرائح متقدمة، قد يهيمن على مجال الذكاء الاصطناعي قريبًا الشركات التقنية الكبرى التي تمتلك الموارد لتطوير نماذج أساسية رائدة مثل GPT-4 وClaude 3.
الارتفاع السريع في تكاليف التدريب والقدرات، خاصة تلك التي تقترب من الأداء البشري أو تتجاوزه، يمثل تحديًا كبيرًا. تفيد شركة Anthropic، وهي لاعب بارز في هذا المجال، بأن تكلفة تدريب نموذجها الرئيسي، Claude 3، تصل إلى حوالي 100 مليون دولار. ومن المتوقع أن تصل النماذج المستقبلية، المتوقع صدورها في 2024 أو أوائل 2025، إلى مستويات قريبة من مليار دولار.
يتطلب فهم هذه التكاليف المتزايدة النظر في التعقيد المتزايد لنماذج اللغة الكبيرة. كل جيل جديد يتميز بعدد أكبر من المعلمات لفهم أعمق، مما يتطلب مزيدًا من البيانات وموارد الحوسبة. بحلول 2025 أو 2026، قد تصل تكاليف التدريب إلى ما بين 5 إلى 10 مليارات دولار، مما يحد من التطوير على عدد قليل من الشركات الكبرى وشركائها.
يماثل مسار صناعة الذكاء الاصطناعي ما شهدته صناعة أشباه الموصلات، التي شهدت تحولًا من الشركات التي تصنع شرائحها بنفسها إلى الاستعانة بمصادر خارجية، حيث ارتفعت التكاليف. اليوم، لا يمكن لثلاث شركات فقط—TSMC وIntel وSamsung—بناء مصانع تصنيع متقدمة، حيث تقدر TSMC أن مصنعًا جديدًا لأشباه الموصلات قد يكلف حوالي 20 مليار دولار.
بينما لا تتطلب كل تطبيقات الذكاء الاصطناعي نماذج لغة كبيرة متطورة، فإن تأثير ارتفاع التكاليف يختلف. في مجال الحوسبة، غالبًا ما تستخدم وحدة المعالجة المركزية (CPU) شرائح متطورة، ولكنها تعمل جنبًا إلى جنب مع شرائح أبطأ لا تتطلب أحدث التقنيات. بالمثل، يمكن للنماذج البديلة الأصغر مثل Mistral وLlama3، التي تستخدم مليارات المعلمات، تقديم حلول فعالة بتكاليف أقل. نموذج Microsoft Phi-3، وهو نموذج لغة صغير (SLM) يحوي 3.8 مليار معلمة، يُظهر هذه المقاربة، حيث يقلل التكاليف من خلال الاعتماد على مجموعة بيانات أصغر مقارنة بالنماذج الأكبر.
قد تكون هذه النماذج الأصغر مثالية لمهام محددة لا تتطلب معرفة شاملة عبر مجالات متعددة. على سبيل المثال، يمكن تخصيصها لمعالجة بيانات محددة للشركة أو احتياجات الصناعة، مما ينتج عنه استجابات دقيقة أو مخرجات بحثية مفصلة. كما قال المحلل الكبير في الذكاء الاصطناعي روان كوران من Forrester Research: "لا تحتاج دائمًا إلى سيارة رياضية. أحيانًا تحتاج إلى ميني فان أو شاحنة بيك آب".
ومع ذلك، فإن ارتفاع التكاليف في تطوير الذكاء الاصطناعي يهدد بخلق بيئة يهيمن عليها عدد قليل من اللاعبين الرئيسيين—على غرار أشباه الموصلات الراقية. هذه الم consolidation يمكن أن تكبح الابتكار والتنوع، مما يحد من مساهمات الشركات الناشئة والشركات الأصغر. لمواجهة هذا الاتجاه، من الضروري تعزيز تطوير نماذج لغة متخصصة، ضرورية للتطبيقات المتخصصة، ودعم المشاريع مفتوحة المصدر والجهود التعاونية. ستضمن المقاربة الشاملة أن تكون تقنيات الذكاء الاصطناعي متاحة ومفيدة لمجموعة أوسع من المجتمعات، مما يعزز فرص الابتكار العادل.