أطلقت شركة داتاسور، الناشئة المتخصصة في تسمية النصوص والصوت لمشاريع الذكاء الاصطناعي ومقرها سان فرانسيسكو، منصة "مختبر LLM"—وهي منصة شاملة مصممة لمساعدة الفرق في إنشاء وتطوير تطبيقات نماذج اللغة الكبيرة المخصصة، على غرار ChatGPT.
يوفر مختبر LLM خيارات نشر سحابية ومحلية، مما يمكّن الشركات من تطوير تطبيقات الذكاء الاصطناعي التوليدية الداخلية مع تقليل المخاطر المرتبطة بالأعمال وخصوصية البيانات التي غالبًا ما تكون مرتبطة بالخدمات المقدمة من طرف ثالث. وهذا يمنح الفرق تحكمًا أكبر في مشاريعها.
قال إيفان لي، الرئيس التنفيذي ومؤسس داتاسور: “لقد أنشأنا أداة تعالج نقاط الألم الشائعة، تدعم أفضل الممارسات المتطورة، وتجسد فلسفتنا التصميمية لتبسيط العملية.” وأشار: “استنادًا إلى تجربتنا في بناء نماذج مخصصة للاستخدام الداخلي والعملاء، قمنا بتطوير منتج LLM قابل للتوسع وسهل الاستخدام.”
الميزات الرئيسية لمختبر LLM من داتاسور
منذ تأسيسها في عام 2019، كانت داتاسور تعمل على تطوير منصة قوية لتسمية البيانات للذكاء الاصطناعي ومعالجة اللغة الطبيعية. إن إطلاق مختبر LLM يمثل تطورًا كبيرًا في هذه العروض.
وأوضح لي: “هذه الأداة تتجاوز تركيزنا التقليدي على معالجة اللغة الطبيعية، الذي يشمل طرقًا مثل التعرف على الكيانات وتصنيف النصوص.” وأضاف: “تمثل نماذج اللغة الكبيرة الجيل الجديد من تقنيات اللغة، ونسعى لأن نكون الحل المفضل في الصناعة لتطبيقات الذكاء الاصطناعي المتعلقة بالنصوص والمستندات والصوت.”
حاليًا، يوفر مختبر LLM واجهة موحدة لمختلف مكونات تطوير تطبيقات LLM، بما في ذلك استيعاب البيانات الداخلية، وتحضير البيانات، وإنشاء المحتوى المعزز بالاسترجاع (RAG)، واختيار النماذج المدمجة، وتحسين استجابات LLM. تم تصميم المنتج مع مراعاة مبادئ التعديل، والتركيب، والبساطة، والصيانة.
وأضاف لي: “تدير هذه الطريقة بكفاءة مختلف تضمينات النصوص، وقواعد بيانات المتجهات، والنماذج الأساسية. الطبيعة الديناميكية لمجال LLM تتطلب منصة لا تعتمد على تقنية محددة، مما يسمح للمستخدمين بتبديل التقنيات للحصول على حلول مثلى.”
للشروع في استخدام مختبر LLM، يختار المستخدمون نموذجًا أساسيًا ويضبطون الإعدادات المرتبطة، مثل درجة الحرارة وطول الاستجابة الأقصى. وتشمل النماذج المدعومة Llama 2 من ميتا وفالكُن من معهد الابتكار التكنولوجي في أبوظبي وكلود من أنثروبيك، بالإضافة إلى Pinecone لقواعد بيانات المتجهات.
بعد ذلك، يمكن للمستخدمين اختيار قوالب للمطالبات لاختبار فعاليتها ورفع المستندات لتطبيق RAG. بعد هذه التهيئات، يمكنهم إنهاء الإعدادات للحصول على أداء عالي الجودة ونشر التطبيق. ثم يمكن للمستخدمين تقييم الأزواج بين المطالبات والإنجازات وإدخال ملاحظاتهم لتعديل النموذج من خلال التعلم المعزز عبر تغذية راجعة بشرية (RLHF).
التغلب على التحديات التقنية
على الرغم من أن لي لم يكشف عن عدد الشركات التي تختبر مختبر LLM حاليًا، إلا أنه أبلغ عن ردود فعل إيجابية من المستخدمين الأوائل. وأبرز ميشيل هاندكا، مؤسس ومدير تنفيذي لشركة GLAIR.ai، أن المختبر يسهل التواصل بشكل أفضل بين فرق الهندسة والفرق غير الهندسية، مما يكسر الحواجز أمام تطوير تطبيقات LLM.
قدمت داتاسور دعمًا بالفعل لصناعات رئيسية مثل المالية والقانون والرعاية الصحية، في تحويل البيانات غير المنظمة إلى مجموعات بيانات قيمة للتعلم الآلي. وتشمل الشراكات الملحوظة كوالتريكس، وأونترا، وكونسنسوس، وليغالتك، وفون ووبيسر وسيرا.
أشار لي: “ندعم رواد الصناعة ذوي الرؤية المستقبلية ونتوقع زيادة الإيرادات خمسة أضعاف في عام 2024.”
التطورات المستقبلية لداتاسور ومختبر LLM
في العام المقبل، تخطط داتاسور لتعزيز مختبر LLM واستثمار المزيد في تطوير LLM على مستوى المؤسسات. سيتمكن المستخدمون من حفظ التهيئات الناجحة ومشاركة الأفكار مع زملائهم. كما سيضم المختبر نماذج أساسية جديدة وناشئة.
نظرًا للارتفاع في الطلب على تطبيقات LLM المخصصة التي تركز على الخصوصية، فإن مختبر LLM على استعداد لإحداث تأثير ملحوظ. وفقًا لتقرير استطلاع LLM لعام 2023، يستخدم حوالي 62٪ من المشاركين تطبيقات LLM مثل ChatGPT وGitHub Copilot لوظائف مثل الدردشة، ودعم العملاء، والترميز.
في ظل تزايد مخاوف الخصوصية، ينتقل العديد من الشركات من النماذج العامة إلى الحلول الداخلية المخصصة التي تلتزم بمعايير الأمان والخصوصية والتنظيم.