الذكاء الاصطناعي التوليدي لديه القدرة على تعزيز إنتاجية البشر بشكل كبير، ومع ذلك، فإن القليل من المنظمات فقط تمتلك الخبرة والموارد اللازمة لتطوير وتدريب نماذج أساسية جديدة من الصفر. تكمن التحديات في نقطتين: أولاً، أصبحت عملية جمع بيانات التدريب اللازمة أكثر صعوبة بسبب حقوق الملكية الفكرية الصارمة التي يملكها أصحاب المحتوى. ثانياً، يمكن أن تكون الموارد المالية المطلوبة لتدريب النماذج باهظة التكلفة. ومع ذلك، فإن الفوائد الاجتماعية لجعل تقنيات الذكاء الاصطناعي التوليدي متاحة على نطاق واسع كبيرة.
فكيف يمكن للشركات الصغيرة أو المطورين الأفراد دمج الذكاء الاصطناعي التوليدي في تطبيقاتهم؟ الحل يكمن في إنشاء ونشر نسخ مخصصة من النماذج الأساسية الموجودة.
نظرًا للاستثمار الكبير المطلوب لتطوير نماذج جديدة من الذكاء الاصطناعي التوليدي، يجب أن تكون هذه النماذج متعددة الاستخدامات لتلبية احتياجات تطبيقات متنوعة—مثل الطرق العديدة التي يتم بها استخدام نماذج تعتمد على GPT حالياً. ومع ذلك، قد لا تفي النماذج العامة بالاحتياجات المحددة لمجالات مختلفة. استخدام نموذج عام كبير لتطبيق متخصص قد يؤدي أيضًا إلى استهلاك غير ضروري للموارد الحاسوبية والوقت والطاقة.
لذا، فإن معظم الشركات والمطورين يستفيدون بشكل أفضل من بدء العمل مع نموذج كبير من الذكاء الاصطناعي التوليدي كأساس، وتكييفه ليناسب احتياجاتهم المحددة مع جهد تطوير أقل بكثير. توفر هذه المقاربة أيضًا مرونة في البنية التحتية من خلال استخدام المعالجات المتاحة أو المسرعات الذكية، مما يتجنب المشاكل المتعلقة بنقص وحدات معالجة الرسوميات. المفتاح هو التركيز على حالة الاستخدام المحددة، وتقليل نطاق المشروع مع تحسين المرونة من خلال البرمجيات المفتوحة والمبنية على معايير معينة والأجهزة متاحة على نطاق واسع.
اتباع نهج حالة الاستخدام في تطوير تطبيقات الذكاء الاصطناعي
في تطوير البرمجيات، توضح حالة الاستخدام خصائص المستخدم المستهدف، والمشكلة التي يجب حلها، وكيف سيحقق التطبيق ذلك. وتحدد هذه التعريفات متطلبات المنتج، وتؤثر على بنية البرمجيات، وتوفر خريطة طريق لدورة حياة المنتج. والأهم من ذلك، أنها توضح ما هو خارج نطاق المشروع.
في مشاريع الذكاء الاصطناعي التوليدي، يمكن أن يساهم تحديد حالة الاستخدام في تقليل حجم النموذج، واحتياجات الحوسبة، واستهلاك الطاقة، بينما يعزز الدقة من خلال التركيز على مجموعة بيانات محددة. يقود هذا النهج المستهدف إلى تقليل جهود التطوير والتكاليف.
تختلف العوامل التي تحدد حالة الاستخدام في الذكاء الاصطناعي التوليدي باختلاف المشاريع، ولكن يمكن أن تكون هناك أسئلة توجيهية تساعد في ذلك:
- متطلبات البيانات: ما نوع وكمية بيانات التدريب اللازمة والمتاحة؟ هل البيانات منظمة (مستودع بيانات) أم غير منظمة (مستودع بيانات ضخم)؟ ما القيود المطبقة؟ كيف سيتعامل التطبيق مع البيانات—عبر المعالجة الدفعة أو البث؟ ما هو تكرار تحديثات النموذج؟ تدريب نماذج اللغة الكبيرة (LLMs) من الصفر يستغرق وقتًا طويلاً، لذا إذا كانت المعرفة في الوقت الحقيقي ضرورية لتطبيقك (مثل الرعاية الصحية)، قد تكون هناك طرق بديلة لضمان بيانات محدثة.
- متطلبات النموذج: تعتبر اعتبارات مثل حجم النموذج، الأداء، وشفافية النتائج حاسمة عند اختيار النموذج المناسب. يمكن أن يتراوح أداء LLMs من مليارات إلى تريليونات من المعلمات—تقدم Llama 2 من Meta إصدارات تتراوح من 7 إلى 70 مليار معلمة، بينما يُقال إن GPT-4 من OpenAI يحتوي على 1.76 تريليون معلمة. النماذج الأكبر عادةً ما تؤدي إلى أداء أعلى، ولكن قد تتوافق النماذج الأصغر بشكل أفضل مع احتياجاتك. تسمح النماذج المفتوحة بتخصيص أعمق، بينما تقدم النماذج المغلقة حلولاً جاهزة مع إمكانية الوصول إلى واجهة برمجة التطبيقات. يعد تخصيص نموذج لبياناتك أمرًا مهمًا للتطبيقات التي تحتاج إلى تتبع، مثل توليد ملخصات البيانات المالية للمستثمرين، بينما يمكن أن تكفي نموذج جاهز لمهام إبداعية مثل توليد نصوص إعلانية.
- متطلبات التطبيق: تحديد المعايير الضرورية للدقة، والكمون، والخصوصية، والسلامة. كم عدد المستخدمين المتزامنين يجب أن يدعمها؟ كيف سيتفاعل المستخدمون مع التطبيق؟ على سبيل المثال، سيكون لطريقة تشغيل نموذجك على جهاز منخفض الكمون أو في بيئة سحابية ذات سعة عالية تأثير كبير على قرارات التنفيذ.
- متطلبات الحوسبة: بمجرد توضيح العوامل السابقة، حدد الموارد الحاسوبية اللازمة. هل تحتاج إلى معالجة البيانات بشكل متوازي باستخدام Modin*؟ هل تتطلب متطلبات التخصيص والاستدلال إعداد سحابياً مه الهجينة؟ حتى وإن كان لديك المواهب والبيانات لتطوير نموذج ذكاء اصطناعي توليدي من الصفر، قيّم ما إذا كان ميزانيتك قادرة على دعم تحديث البنية التحتية اللازمة.
ستوجه هذه الاعتبارات المناقشات لتحديد نطاق متطلبات مشروعك. فالجوانب المالية—التي تشمل هندسة البيانات، نفقات التطوير الأولية، ونموذج الأعمال الذي يدعم تكاليف الاستدلال—تحدد أيضًا استراتيجيات البيانات، والتدريب، والنشر.
كيف يمكن لتقنيات الذكاء الاصطناعي التوليدي من Intel المساعدة
تقدم Intel حلولاً متنوعة من أجهزة الذكاء الاصطناعي تناسب احتياجات الحوسبة المختلفة. لتعظيم إمكانيات جهازك، توفر Intel إصدارات محسّنة من أدوات تحليل البيانات الشائعة وأدوات الذكاء الاصطناعي من البداية إلى النهاية. مؤخرًا، قدمت Intel نموذجًا محسّنًا، وهو أول نموذج مصنف بـ 7 مليار معلمة على لوحة القيادة LLM المفتوحة من Hugging Face (اعتبارًا من نوفمبر 2023). يمكن أن تلبي هذه الموارد، بالإضافة إلى تلك الموجودة في نظام مطوري الذكاء الاصطناعي من Intel، متطلبات دقتك، وكمونك، وحمايتك. ابدأ بالاستفادة من مئات النماذج المدربة مسبقًا المتاحة على Hugging Face أو GitHub والمُحسّنة لأجهزة Intel. يمكنك معالجة البيانات باستخدام أدوات Intel مثل Modin، وضبط نماذج الأساس باستخدام أدوات مثل Intel® Extension for Transformers أو Hugging Face Optimum، وأتمتة ضبط النموذج مع SigOpt، استنادًا إلى تحسينات تم تقديمها لإطارات الذكاء الاصطناعي مفتوحة المصدر بما في ذلك TensorFlow وPyTorch وDeepSpeed.
أمثلة على حالات استخدام الذكاء الاصطناعي التوليدي
1. خدمة العملاء: حالة استخدام الدردشة
تعزز الدردشة المعتمدة على LLM كفاءة الخدمة من خلال تقديم استجابات فورية للتحقيقات الشائعة، مما يتيح للممثلين معالجة قضايا أكثر تعقيدًا. يمكن للنماذج العامة التحدث بالعديد من اللغات ولكن قد تفتقر إلى معرفة محددة عن الأعمال أو قد "تتخيل" معلومات بثقة على الرغم من عدم وجود أساس. يتم تحديث النموذج تدريجيًا مع تقنيات استرجاع، مثل الجيل المعزز بالاسترجاع (RAG)، التي تستخرج البيانات ذات الصلة من قاعدة بيانات خارجية مبنية من مستندات الأعمال الخاصة. كلاهما يوفر استجابات تتسم بالسياق ويمكن أن يستفيد من وحدات المعالجة المركزية المتاحة مثل Intel® Xeon® Scalable processors.
2. التجزئة: حالة استخدام التجربة الافتراضية
يمكن للذكاء الاصطناعي التوليدي تقديم تجارب تسوق عبر الإنترنت غامرة، مثل التجربة الافتراضية، مما يعزز رضا العملاء ويعزز كفاءة سلسلة التوريد. تأسست هذه التطبيق على توليد الصور ويجب أن تركز على خط الملابس المحدد. قد يتطلب ضبط نماذج الصور مثل Stable Diffusion عددًا محدودًا من الصور المعالجة على منصات المعالجات المركزية. لحماية خصوصية العملاء، يجب أن يتم تخزين الصور محليًا، ربما على أجهزة المستهلكين.
3. الرعاية الصحية: حالة استخدام مراقبة المرضى
يمكن أن يؤدي دمج الذكاء الاصطناعي التوليدي مع مراقبة المرضى في الوقت الحقيقي إلى توليد تقارير وخطط عمل مخصصة. تتطلب هذه الحالة استخدام ذكاء اصطناعي متعدد الأنماط لمعالجة أنواع مختلفة من البيانات المدخلة وتوليد تقارير. يثير تدريب النماذج في الرعاية الصحية مخاوف تتعلق بالخصوصية، مما يتطلب أن تبقى بيانات المرضى مع مقدمي الخدمة. يتيح التعلم الفيدرالي للنموذج أن يتدرب محليًا دون نقل البيانات الحساسة. بينما يعتبر الاستدلال المحلي مثاليًا، قد تكون الحلول الهجينة التي تشمل كل من المكونات السحابية والحافة ضرورية، مما قد يتطلب تقنيات تحسين.
كيف تبدأ
ابدأ بتحديد حالة الاستخدام الخاصة بك باستخدام الأسئلة التوجيهية أعلاه لتوضيح المتطلبات الخاصة بالبيانات، والحوسبة، والنموذج، والتطبيق. بعد ذلك، استكشف النماذج الأساسية ذات الصلة، والتنفيذات المرجعية، والموارد المجتمعية المتاحة في نظام الذكاء الاصطناعي. حدد واستخدم تقنيات التخصيص والتحسين الأنسب لمشروعك.
قد تستغرق تلبية احتياجات الحوسبة بعض الوقت، وغالبًا ما تتطور على مدار المشروع. يقدم Intel® Developer Cloud مجموعة متنوعة من وحدات المعالجة المركزية والرسومات ومسرعات الذكاء الاصطناعي لمساعدتك في بداية تطويرك.
أخيرًا، لتسهيل الانتقال بين منصات الحوسبة المختلفة أثناء التطوير والنشر، اختر أدوات الذكاء الاصطناعي والأطر التي تعتمد على المعايير، والتي تتسم بالأداء الأمثل عبر أجهزة متنوعة دون الحاجة إلى إعادة كتابة شاملة للكود.