في عام 2023، أطلقت ChatGPT ثورة في التكنولوجيا، حيث تطورت بسرعة من وكلاء ذكاء اصطناعي تفاعليين بسيطين إلى فهرسة الوثائق، والاتصال بمصادر البيانات، وإجراء تحليلات البيانات من خلال جملة واحدة فقط. على الرغم من الوعود العديدة بتقديم نماذج لغات كبيرة (LLMs)، إلا أن القليل منها تحقق، وذلك بسبب:
- نحن نبني وكلاء ذكاء اصطناعي، وليس نماذج لغوية كبرى.
- التركيز أكثر على البحث بدلاً من الهندسة.
- هناك فائض من البيانات السيئة.
تستعرض هذه المقالة دور وكلاء الذكاء الاصطناعي في دمج نماذج LLMs مع الأنظمة الخلفية، وإمكانات هؤلاء الوكلاء كجيل جديد من واجهات المستخدم وتجربة المستخدم (UI/UX)، والحاجة إلى إعادة تقديم مبادئ الهندسة البرمجية الأساسية التي غالبًا ما يتم تجاهلها اليوم.
أريد بيتزا خلال 20 دقيقة
تقدم نماذج LLMs واجهات مستخدم وتجارب مستخدم أكثر سهولة وتناسبًا مقارنة بالواجهات التقليدية. خذ مثالاً على طلب "بيتزا مارجريتا غرامية يتم توصيلها خلال 20 دقيقة" من خلال تطبيق توصيل.
في واجهة المستخدم التقليدية، قد تتضمن تلبية هذا الطلب البسيط ظاهريًا خطوات معقدة عديدة وتأخذ عدة دقائق. قد تحتاج إلى:
- اختيار فئة "البيتزا".
- تصفح قوائم المطاعم والصور.
- فحص القوائم للبيتزا المارجريتا.
- تأكيد سرعة التوصيل.
- العودة خطوة للوراء إذا لم يتم تلبية أي من المعايير.
نحتاج إلى أكثر من نماذج LLMs
بينما تتفوق نماذج LLM مثل GPT-3 في معالجة اللغة الطبيعية (NLP) وتوليد استجابات متماسكة وملائمة للسياق، تتوسع قدراتها بشكل كبير عند دمجها مع مصادر بيانات خارجية، وخوارزميات، وواجهات متخصصة. تتيح هذه التكاملات القيام بمهام لا يمكن لنماذج LLMs الحالية التعامل معها بشكل منفرد.
على سبيل المثال، يتطلب طلب البيتزا اتصالات مع أنظمة مختلفة—قواعد بيانات المطاعم، إدارة المخزون، تتبع التوصيل، وأكثر. لتقديم تجربة سلسة لطلبات متنوعة، من الضروري إجراء تكاملات إضافية، حيث لا يمكن لنماذج LLMs بمفردها إدارة هذه التعقيدات.
وكلاء الذكاء الاصطناعي
تشكل نماذج LLMs العمود الفقري لوكلاء الذكاء الاصطناعي. للتعامل مع استفسارات متنوعة، يستخدم وكلاء الذكاء الاصطناعي نموذج LLM جنبًا إلى جنب مع مكونات مساعدة متعددة:
- النواة الأساسية: تنسق الوظائف العامة باستخدام LLM.
- وحدة الذاكرة: تيسير اتخاذ قرارات مبنية على السياق.
- المخطط: يحدد مسار عمل الوكيل بناءً على الأدوات المتاحة.
- الأدوات والموارد: تدعم مجالات معينة، مما يمكّن من معالجة البيانات بكفاءة، والتفكير، وتوليد الاستجابات. تشمل هذه المصادر البيانات، والخوارزميات، والتصورات.
تقدم هذه الورقة البحثية نظرة شاملة على وكلاء الذكاء الاصطناعي ومكوناتهم.
دمج وكلاء الذكاء الاصطناعي المعتمدين على نماذج LLM: تحدي هندسي
ت simplifies اللغة الطبيعية مواصفات الحالة في تطوير البرمجيات، ولكن غموضها يمكن أن يؤدي إلى أنظمة ذات تعريفات غير واضحة.
تسلط كتاب فريد بروكس الكلاسيكي عام 1975، "أسطورة الرجل الشهر"، الضوء على مبادئ أساسية في الهندسة البرمجية تم تجاهلها في مرحلة نماذج LLM، بما في ذلك:
- لا توجد رصاصة فضية: لا يمكن لأي تطوير واحد أن يحل محل ممارسات الهندسة البرمجية السليمة، بما في ذلك استخدام نماذج LLMs.
- الوثائق اليدوية والرسمية: في عصر الدعاية، تعتبر الوثائق أساسية. طلب نظام "لطلب بيتزا مارجريتا غرامية في 20 دقيقة" غير كافٍ. تعتبر الوثائق الشاملة ضرورية لحالات الاستخدام المتنوعة، والمتطلبات الخلفية، والتصورات الجديدة، والأهم من ذلك، حدود النظام. عبارة "أشياء مثل" أصبحت شائعة في تطوير نماذج LLM، متجاهلة تعقيد اتصالات الأنظمة وتصور البيانات.
(استكشف المزيد من مبادئ بروكس على مدونة Zscaler).
تناقش ورقتنا البحثية الأخيرة نقص المواصفات الصحيحة للأنظمة البرمجية، مقدمة إطار عمل لإنشاء مواصفات رسمية للأنظمة الذكية المعتمدة على نماذج LLM بما يتماشى مع مبادئ الهندسة البرمجية السليمة.
تحدي البيانات السيئة
لكي تعمل وكلاء الذكاء الاصطناعي المعتمدين على نماذج LLM بفعالية، فإن التنظيم الرسمي للبيانات ومنهجيات الكتابة أمر حاسم. تزدهر أنظمة LLM على الوثائق العالية الجودة. وقد أكدت OpenAI أن تدريب نماذج الذكاء الاصطناعي "مستحيل" بدون استخدام نصوص محمية بحقوق الطبع والنشر؛ وبالتالي، فإن الحاجة إلى كميات كبيرة من النصوص المكتوبة جيدًا أمر أساسي.
تزداد هذه الحاجة بفضل التقنيات المعتمدة على RAG حيث يتم فهرسة أجزاء الوثائق في قواعد بيانات المتجهات. عند طرح المستخدم سؤالاً، يتم إرجاع الوثائق الأعلى تصنيفًا إلى LLM مولد لصياغة إجابة متماسكة.
الخاتمة
على الرغم من الوعود العديدة المحيطة بنماذج LLM، فإن القليل منها يتحقق. لتحويل هذه الوعود إلى واقع، يجب أن ندرك أننا نطور أنظمة هندسة برمجية معقدة، وليس مجرد نماذج أولية.
تقديم تصميم للأنظمة الذكية المعتمدة على نماذج LLM يعكس تعقيدًا كبيرًا. يجب تأسيس مواصفات وبروتوكولات اختبار دقيقة، ويجب اعتبار البيانات مكونًا مركزيًا، حيث أن هذه الأنظمة حساسة بشكل خاص تجاه البيانات ذات الجودة المنخفضة.