تتقدم نماذج اللغة الكبيرة (LLMs) اليوم نحو مزيد من التعقيد، إلا أن البيانات التي تعتمد عليها في توليد الردود غالبًا ما تبقى ثابتة، مما يؤدي إلى معلومات قد تكون قديمة بأسابيع أو حتى أشهر.
تجعل هذه المشكلة من توليد المحتوى المعزز بالاسترجاع (RAG) أمرًا حيويًا للمؤسسات الحديثة، حيث يتيح توليد مخرجات حديثة وخاصة بالشركة. ومع ذلك، فإن عمليات الاسترجاع تواجه تحديات في الدقة والتوسع والأمان، خاصة عند التعامل مع محتوى المؤسسات المعقد.
لمواجهة هذه التحديات، قامت Pryon بتقديم محرك استرجاع Pryon، وهو منصة متقدمة تقوم باستخراج المعلومات بشكل آمن من محتوى متنوع ومعقد، مما يمكّن المنظمات من تعزيز استخدام أدوات الذكاء الاصطناعي الحديثة.
"موثوقية المحتوى المتولد موضع تساؤل، والانحياز يعتبر قضية كبيرة"، قال كريس ماهل، رئيس مساعد Pryon. "بعض النماذج تعتبر مجمدة في الزمن. بينما قد تطرح سؤالًا عميقًا، فإن الإجابة تأتي من معلومات قديمة، مما يشكل مشكلة كبيرة".
بناء قاعدة معرفية متسقة
تواجه طرق استيعاب البيانات الحالية صعوبات مع المحتوى القائم على الوثائق المعقدة، مما يجعل الدقة صعبة التحقيق على نطاق واسع. بالإضافة إلى ذلك، فإن المحتوى غالبًا ما يكون متشتتًا عبر أنظمة وصيغ متعددة.
يتجاوز محرك استرجاع Pryon هذه العقبات من خلال دمج ملايين قطع البيانات في قاعدة معرفية متكاملة، تُعرف باسم "مجموعة". يستخدم النظام الشبكات العصبية الدلالية، وتحليل الوثائق، والتعرف البصري على الأحرف (OCR) لاستخراج النص من الصور والرسوم والجداول وحتى الملاحظات المكتوبة بخط اليد. كما يُستخدم تقسيم الفيديو لتحديد العناصر الرئيسية وتطبيع المحتوى.
يمكن للمستخدمين طرح الأسئلة بأي تنسيق، مع الحصول على إجابات خلال أجزاء من الثانية. يصف ماهل هذا النظام المعلوماتي المتعدد الطبقات بأنه "نسيج معرفي"، مشددًا على تعقيده أكثر من مجرد استرجاع.
لضمان الأمان، تدمج Pryon قوائم التحكم في الوصول (ACLs) لتحديد حقوق الوصول الخاصة بالمستخدمين. النظام مرن أيضًا للنشر في البيئات المحلية والعامة والخاصة، بالإضافة إلى إعدادات الهواء المعزول.
تمكّن المكونات المسبقة البناء المؤسسات من تنفيذ تطبيقات ذكاء اصطناعي توليدية جاهزة للإنتاج في غضون أسبوعين فقط، بينما توفر واجهة بدون كود تحديثات في الوقت الفعلي. يستجيب المحرك عبر واجهة برمجة التطبيقات للنشر المخصص ويتكامل بسلاسة مع منصات مثل Microsoft SharePoint وConfluence وAWS S3 وGoogle Drive وZendesk وServiceNow وSalesforce.
"جميع المعلومات الذاتية — بغض النظر عن الشكل، من المخططات المعقدة إلى التقارير الطويلة — تُرفع بشكل آمن إلى نموذج، مما يتيح للمستخدمين التفاعل بشكل حواري والحصول على إجابات دقيقة وقابلة للتأكيد"، أضاف ماهل.
الاستخدامات عبر الصناعات
استخدم أحد العملاء Pryon في مقر الشركة لتجميع 400,000 وثيقة تقنية تم الوصول إليها من قبل 5,000 مستخدم، مع تقديم إجابات دقيقة خلال أجزاء من الثانية. في حالة أخرى، استفادت شركة تقنية الألعاب من Pryon لمساعدة ملايين العملاء في طرح استفسارات تقنية معقدة على موقع الدعم الخاص بهم. تُجدد هذه البوابة عدة مرات يوميًا.
وبالمثل، دعمت Pryon شركة هندسية بتوفير وصول سريع إلى ملايين الوثائق الأساسية للحفاظ على الأنظمة الحيوية. كما دمجت شركات التأمين Pryon لتعزيز عمليات الاكتتاب، بينما تستخدم الشركات ذات المنتجات المعقدة المحرك لتمكين فرق المبيعات من الحصول على المعرفة بشكل فوري.
"طبقة بيانات الاسترجاع، وطبقة البيانات الجاهزة لـ RAG، هي من أهم الأصول في أي منظمة"، علق ماهل. "لذا فإن وجود بنية تحتية آمنة وقابلة للتوسع لإدارة هذه المعلومات أمر أساسي".
التنقل في البيانات الموزعة في المؤسسات
تشكل البيانات أساس القيمة في المؤسسات، إلا أن فهمها غالبًا ما يكون محدودًا. تتواجد البيانات بأشكال متعددة — فيديو، نصوص طويلة، رسائل إلكترونية، وثائق مالية، وحتى ميكروفيس — مما يجعل من الصعب تحديد المعلومات الحيوية.
تمتلك الشركات كميات هائلة من البيانات المعقدة والعالية القيمة التي يمكن أن تسرع من تطوير المنتجات. ومع ذلك، فإن العثور على البيانات ذات الصلة لمشاريع محددة يمكن أن يكون شبه مستحيل. على سبيل المثال، قد تمتلك شركة هندسة شرائح ملايين الوثائق الموزعة عبر أقسام بحث متعددة.
"لقد كان من enlightening العمل مع شركات مرموقة وإدراك مدى تشتت معلوماتها"، قال ماهل. "الذكاء الاصطناعي التوليدي حاضر الآن، لكنه يواجه تحديات كبيرة بسبب تشتت البيانات داخل المؤسسات".
شدد ماهل على أهمية الأمان، معترفًا بالحماس المحيط بالذكاء الاصطناعي التوليدي مع التحذير من القلق العميق بشأن خصوصية البيانات وأمانها. مع تقدير العوائد العالمية للذكاء الاصطناعي التوليدي بقيمة تصل إلى 4.4 تريليون دولار سنويًا، تظل المؤسسات حذرة من كشف بياناتها الذاتية للذكاء الاصطناعي العام والسحابة.
"أؤكد باستمرار على الأمن، الأمن، الأمن"، أكد ماهل. "هذا المستوى من السيطرة على الأمان هو أحد المبادئ التوجيهية لنا".
رفع مستوى فهم الأسئلة في الذكاء الاصطناعي
لكي تقدم الذكاء الاصطناعي إجابات دقيقة، يجب أولاً أن يفهم دقة الأسئلة. تم تصميم أنظمة Pryon لفهم تعقيدات الاستفسارات، مع مراعاة كل شيء من العناوين إلى تخطيط التصميم.
يستخدم المحرك توسيعات الاستفسار، وكشف المجال خارج النطاق، وتضمين الاستفسارات لتفسير الاستفسارات بلغة طبيعية، مستخدمًا ثلاثة نماذج ملكية لتحديد وترتيب المحتوى ذي الصلة.
أشار ماهل إلى أن الأفراد يطرحون أسئلة حول نفس الموضوع بطرق متعددة. على سبيل المثال، "كم زادت الإيرادات هذا العام مقارنة بالعام الماضي؟" مقارنةً بـ "ما كانت الإيرادات العام الماضي؟"
"بمجرد أن تحصل على ذكاء منظم، يصبح من الضروري الاستعداد للرد بدقة على سؤال مطروح بطرق متعددة"، أوضح ماهل. تتضمن هذه العملية دراسة السؤال الأساسي، وتقييم المحتوى، وتوليد مجموعة متنوعة من الاستفسارات المحتملة.
ضمان نسبة دقيقة لإجابات الذكاء الاصطناعي
تعتبر النسبة الدقيقة أمرًا حيويًا لمنع النماذج من "التخيل"، أو تقديم معلومات غير صحيحة.
"بينما يستخدم العديد منا ChatGPT ونماذج أخرى، قد يكون من غير الواضح من أين تنشأ الإجابات"، اعترف ماهل.
توضح Pryon هذا بضمان أن جميع الإجابات المتولدة تأتي من مصادر معلومات موثوقة وموثوقة. يتيح ذلك للمستخدمين طرح أسئلة متعددة الأجزاء، مع استجابات مستمدة من مصادر متنوعة، وكلها مع الإشارة الواضحة.
"تم تصميم منصة Pryon لتمكين المديرين التنفيذيين لتكنولوجيا المعلومات والمديرين التقنيين والفنيين، مما يمنحهم السيطرة على معلوماتهم غير المنظمة وشبه المنظمة لتحسين الأداء"، اختتم ماهل.