تقديم أول نموذج لغوي كبير مدرب بشكل عادل: عصر جديد في تطوير الذكاء الاصطناعي

"سيكون من المستحيل تدريب النماذج الرائدة للذكاء الاصطناعي اليوم دون استخدام مواد محمية بموجب حقوق الطبع والنشر"، كما صرحت OpenAI في ملفها المقدم إلى مجلس اللوردات البريطاني، والذي أثار عناوين الأخبار عبر الإنترنت في وقت سابق من هذا العام.

في الحقيقة، هذا الجدال هو جوهر الدفاع العام والقانوني للشركة حول ممارساتها المثيرة للجدل في استخراج البيانات بشكل جماعي، التي استخدمتها لتدريب نماذج الذكاء الاصطناعي الخاصة بها، بما في ذلك نماذج اللغة الكبيرة GPT-3.5/4 التي تدعم منتجها الشهير ChatGPT، وكذلك بشكل غير مباشر المنافسين مثل Google وMistral وMeta وAnthropic وCohere. ينتقد البعض OpenAI لعدم سعيها للحصول على إذن صريح أو دفع رسوم ترخيص لأصحاب البيانات المحمية، بينما تassert الشركة أن ممارساتها تُعد استخدامًا تحويليًا عادلًا وأنها تعمل ضمن المعايير القديمة للإنترنت، حيث تم استخراج المحتوى من قبل العديد من الشركات الأخرى لتغذية فهارس محركات البحث وميزات مفيدة أخرى، دون شكاوى جماعية. ولا تزال المعركة مستمرة في دعاوى قضائية جارية.

لكن نموذجًا جديدًا يتحدى هذا الافتراض، على الأقل يتحدى فكرة أنه من المستحيل إنشاء نموذج مفيد دون الاعتماد على بيانات محمية بحقوق الطبع والنشر.

النموذج الجديد يُسمى KL3M (Kelvin Legal Large Language Model، يُلفظ "كليم")، وهو من تطوير 273 Ventures، وهي شركة ناشئة عمرها عامين شارك في تأسيسها دانيال مارتن كاتز، أستاذ القانون في معهد إلينوي للتكنولوجيا والرئيس التنفيذي للاستراتيجية، و"متعاون دائم" له، مايكل بوماريتو، رجل أعمال في مجال التكنولوجيا القانونية الذي يشغل منصب الرئيس التنفيذي لشركة 273 Ventures. سبق لهذا الثنائي أن أسس LexPredict، وهي شركة تكنولوجيا قانونية سابقة، وباعها لشركة Elevate القانونية العالمية.

تم إصدار KL3M في أواخر فبراير 2024، ولكنه اليوم نال شرف كونه أول نموذج لغة كبيرة يحصل على "شهادة نموذج مرخص (L)" من الشركة المستقلة Fairly Trained، وهي منظمة غير ربحية أسسها وأدارها إد نيوتن-ريكس، المسؤول السابق في Stability AI، في وقت سابق من هذا العام. كانت مجلة Wired، التي تعمل زوجتي كمديرة تحرير فيها، هي أول من نشر الأخبار.

تُمنح شهادة Fairly Trained (L) فقط لتلك الشركات التي يمكن أن تثبت من خلال عملية تقديم ومراجعة أن بيانات تدريب نموذج الذكاء الاصطناعي لديها تم الحصول عليها واستخدامها بموجب "اتفاق تعاقدي مع طرف يمتلك الحقوق اللازمة للدخول في مثل هذا الاتفاق" أو تعتبر ضمن الملكية العامة/ترخيص مفتوح. وتبلغ رسوم الحصول على الشهادة ما بين 150 دولارًا مسبقًا و500 دولار سنويًا إلى 500 دولار مسبقًا و6000 دولار سنويًا. من الواضح أن KL3M مؤهل لهذه المتطلبات.

"اليوم نحن متحمسون للغاية للإعلان عن أن نموذج Kelvin Legal Large Language Model (KL3M) حصل الآن على شهادة Fairly Trained"، كتب كاتز على حسابه في شبكة X الاجتماعية. "KL3M هو أول نموذج لغة كبيرة (في أي فئة) يحصل على مثل هذه الشهادة".

"يمكن أن يوجد الذكاء الاصطناعي التوليدي دون استغلال الأعمال المحمية بحقوق الطبع والنشر دون إذن"، كتبت Fairly Trained في منشور مدونة تعلن فيه عن شهادة K3LM وأربع جهات أخرى — Voicemod، التي تقدم نماذج صوتية وغنائية مدعومة بالذكاء الاصطناعي، وشركات الموسيقى Infinite Album وLemonaide، ومجموعة Frostbite Orckings المدفوعة بالذكاء الاصطناعي.

كيف تم تدريب KL3M؟

وفقًا لكاتز، الذي تحدث إلى وسائل الإعلام في مقابلة هاتفية قصيرة اليوم، كانت 273 Ventures منذ تأسيسها "تجمع البيانات التي لن تكون إشكالية" من مصادر تشمل إصدارات الوثائق الحكومية الأمريكية والملفات القانونية القديمة — جميعها ضمن الملكية العامة.

"لم نكن متأكدين من أنه يمكن القيام بشيء كهذا [تدريب نموذج ذكاء اصطناعي] دون استخدام كميات هائلة من المعلومات المحمية بحقوق الطبع والنشر"، قال كاتز. "كنا نظن أنه سيكون من الممكن على الأقل في نطاق معين تحقيق النجاح، خصوصًا في المجالات القانونية والمالية والتنظيمية حيث توجد كمية كبيرة نسبيًا من المواد التي لا تحمل حقوق الطبع".

وأشار كاتز إلى أن هذه الصناعات لا تقدم جميعها وثائق ملكية عامة موحدة وأن هذا يختلف بشكل كبير حسب الدولة — على سبيل المثال، في المملكة المتحدة، يمكن لبعض الهيئات الحكومية أو الوكالات فرض حقوق الطبع والنشر على الوثائق والبيانات التي تنتجها.

كانت نسبة كبيرة من الأشهر الأولى لشركة 273 Ventures مكرسة لترتيب الوثائق والبيانات التي يمكن استخدامها لتدريب KL3M دون انتهاك أو حتى المجازفة بالانتهاك. وقد تم دمج تلك البيانات في منتج أيضًا، وهو Kelvin Legal DataPack، الذي يحتوي على أكثر من 150 مليار رمز وتم إصداره في أغسطس 2023.

تم تدريب KL3M، من جانبه، على مجموعة فرعية إنجليزية ذات جودة عالية من Kelvin Legal DataPack، بما في ذلك مراجعة يدوية لـ10,000 وثيقة و"مجموعة بيانات تحتوي على حوالي 350 مليار رمز". تصف 273 Ventures نظام التدريب الخاص بها لـ KL3M بمزيد من التفصيل هنا.

لحد الآن، كانت النتيجة إصدارين من KL3M: kl3m-170m مع 170 مليون معلمة (الخصائص التي تحكم نموذج الذكاء الاصطناعي)، والنموذج الأكبر kl3m-1.7b مع 1.7 مليار معلمة. النموذج kl3m-170m أقل أداء، ولكنه يمكن تشغيله على أجهزة ذات قدرة منخفضة ورخيصة مثل Macbook Air مع شريحة M1، مقارنة بشريحة NVidia RTX 4060 8GB المطلوبة للنموذج الأكبر (والعديد من نماذج LLM الأخرى المتنافسة).

تستعد 273 Ventures أيضًا لإصدار نسخة تحتوي على 3.7 مليار معلمة من KL3M الشهر المقبل.

ما هي فوائد KL3M وكم تكلفته؟

على صفحة منتجها، يتم الترويج لـ KL3M على أنه مفيد لـ"صياغة وتعديل تواريخ العمل والفواتير، وصياغة وتعديل بنود العقود، وصياغة وتعديل إيداعات SEC مثل تقارير 10-K و8-K، [وصياغة براءات اختراع واضحة...]".

ورغم أنه تم تصميمه مع وضع شركات القانون وصناعة القانون في الاعتبار — حيث يكون العملاء حساسين بشكل خاص لقضايا مصدر البيانات والشرعية — قال كاتز للصحافة أنه كان مذهولاً في الواقع من مدى عمومية KL3M خارج هذا القطاع المستهدف.

"فقط فكر في الأمر بهذه الطريقة: القانون يلامس كل موضوع تقريبًا في المجتمع"، أوضح كاتز. "وتنشر الحكومات الكثير من المواد المصدر التي تعلمك المفاهيم واستخدام اللغة... أشعر بالدهشة قليلاً شخصيًا، ولكنه حقًا يتمتع بمدى أوسع مما كنا نعتقد".

عند الإعلان عن النموذج في البداية الشهر الماضي، أنتجت 273 Ventures عدة مخططات تقارن أداء KL3M مع نماذج أخرى في فئته، ووجدوا أن إصدار 1.7 مليار معلمة كان لديه انخفاض (وبالتالي أفضل) perplexity، أو أخطاء توقع الرموز، مقارنةً بـ10 نماذج رائدة أخرى، بما في ذلك GPT-2 Large وopenllama3b_v2 — على الأقل في كتابة المواد القانونية ومدخلات Wiki.

حاليًا، أفاد كاتز أن النموذج يستخدم بالفعل من قبل عدة عملاء في شركات قانونية، لكنه امتنع عن ذكر أسمائها لأسباب تتعلق بالخصوصية.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles