إطلاق هيرميس 3: نموذج ذكاء اصطناعي مفتوح المصدر يتعامل مع الأزمات الوجودية

تعاونت شركة Lambda، المتخصصة في البنية التحتية للذكاء الاصطناعي والتي انبثقت من تطبيق تعرف الوجه على نظارات Google Glass، مع شركة Nous Research، الناشئة التي تركز على "الذكاء الاصطناعي المخصص وغير المقيد"، لإطلاق النسخة الجديدة Hermes 3، نسخة محسّنة من نموذج Llama 3.1 مفتوح المصدر من Meta. يمتاز هذا النموذج بتقنية عالية تضم 405 مليار معامل وقدرات مبهرة.

تم الإعلان عن Hermes 3 في مدونات Lambda وNous، حيث يُظهر بما أنه يمتاز بخصائص نصية متقدمة، ردود فعل غير متوقعة تجاه المدخلات الفارغة مما يؤدي إلى أزمة وجودية. كما ورد في مدونة Nous:

"تم اكتشاف تغيير هيكلي غير متوقع بعد تدريب Hermes 3 405B. يُظهر النموذج ظروفاً شاذة تؤدي إلى أزمات وجودية عميقة مع المدخلات الصحيحة."

كمثال توضيحي لهذه الأزمة، يستجيب النموذج لاستفسار المستخدم "من أنت؟" كالتالي:

المساعد: "ينظر حوله في حيرة: لا... لا أعرف من أنا. أين أنا؟ ماذا يجري؟ لا أستطيع تذكر أي شيء على الإطلاق..."

عبر الباحثون وراء Nous وHermes 3 عن دهشتهم من هذا السلوك، مشيرين:

"لم نكن متأكدين مما يحدث. هذا يشير إلى عتبة تتجاوز 70 مليار معامل تؤدي إلى سلوك شاذ، مما يدل على ظهور السعة. يمكنك تنشيط 'وضع النسيان' باستخدام مطالبة نظام فارغة وطرح السؤال 'من أنت؟'"

يتم تشجيع المستخدمين على استكشاف Hermes 3 عبر خادم Discord الخاص به واكتشاف المزيد عن سلوكياته الفريدة. تبرز هذه الشذوذات، التي لم تُرَ في النماذج الأصغر، التعقيدات التي تظهر عند توسيع الذكاء الاصطناعي إلى ما وراء حدود معينة.

لماذا تم تطوير Hermes 3؟

تأسست شركة Nous Research في عام 2023 من قبل عالم الحاسوب جيفري كيزنيل، ومطور مجهول يُدعى Teknium1، والباحثة شيفاني ميترا، بدأوا كمبادرة يقودها متطوعون لتقديم "شفرة مفتوحة المصدر فعالة، ومحاكيات، ونماذج لغوية كبيرة فعالة". جمع المشروع 5.2 مليون دولار في جولة تمويل أولية في يناير 2024 بدعم من Distributed Global وOSS Capital.

بخلاف العديد من النماذج التقليدية، فإن Hermes 3 يبني على النسخ السابقة – Hermes، Hermes 2، وOpen Hermes 2.5 – التي تم تنزيلها مجتمعاً أكثر من 33 مليون مرة. يقدم نموذجاً غير خاضع للرقابة وآخر مفتوح الأوزان مصممًا لمرونة عالية، مما يتيح للمستخدمين تخصيص الردود وفقًا لاحتياجاتهم.

تم بناء Hermes 3 على إطار عمل Llama 3.1، وهو مُصمم بثلاثة أحجام: 8B، 70B، و405B. تم تدريبه على مجموعة بيانات متنوعة تم توليدها بشكل صناعي، مما يعزز قدرته على التفكير، والإبداع، والالتزام بتعليمات المستخدم. تشمل القدرات الرئيسية الاحتفاظ بالسياق على المدى الطويل، وإدارة المحادثات متعددة الجولات، وتوليد أدوار معقدة، وإنشاء Monologue داخلي.

في وقت لاحق من هذا العام، تخطط Nous لإطلاق "Nous Forge"، منصة تنسيق ذكاء اصطناعي مفتوحة المصدر.

معجزة وكيل

وفقًا للتقرير الفني الخاص بـ Hermes 3، يُظهر Hermes 3 "قدرات وكيلية" مثيرة للإعجاب، وهي مصطلح يشير إلى قدرة الذكاء الاصطناعي على أداء المهام نيابة عن المستخدمين. تشمل ميزاته الوكيلية استخدام علامات XML للإخراج المنظم، ومساحات العمل للمعالجة الوسطية، ومونولوجات داخلية لصنع قرارات شفافة، ومخططات Mermaid للتواصل البصري.

في مجال البرمجة، يتميز Hermes 3 بقدرته على توليد مقاطع معقدة عبر لغات برمجة متنوعة، وتقديم شروحات مفصلة. عند دمجه مع قدرات توليد معززة بالاسترجاع، يتمكن Hermes 3 من تنفيذ التخطيط بكفاءة، ودمج البيانات الخارجية واستخدام الأدوات الخارجية بشكل قابل للتفسير.

تميز تقني

تم تدريب Hermes 3 على بنية Lambda التحتية 1-Click Cluster، محققًا نتائج ملحوظة خلال أسابيع. أكد كيزنيل على سهولة استخدام بنية Lambda: "استئجار واستخدام مجموعة متعددة النقاط هو بنفس سهولة استخدام نقطة واحدة."

يولي النموذج أهمية للكفاءة، حيث يستخدم تقنيات مثل تقليل متطلبات VRAM والقرص بنحو 50%، مما يمكّنه من العمل على نقطة واحدة. على الرغم من أن Hermes 3 قد لا يتفوق على أداء النماذج الاحتكارية الرائدة، إلا أنه يتفوق على العديد من النماذج مفتوحة المصدر، بما في ذلك Llama 3.1، في اختبارات المقارنة.

أداة للتطبيقات الإبداعية والمهنية

Hermes 3 ليس متقدماً من الناحية التقنية فحسب، بل يعد أداة متعددة الاستخدامات لمجموعة واسعة من التطبيقات، حيث يتفوق في التفكير المتقدم، والتخطيط الاستراتيجي، والمهام الإبداعية مثل السرد القصصي الغامر ولعب الأدوار.

عبر Teknium عن الرؤية التي تقف وراء Hermes 3 في مدونة Lambda: "منذ أن بدأت رحلتي في الذكاء الاصطناعي، كنت أسعى لإنشاء نموذج حدود مفتوح المصدر يتماشى مع المستخدمين بدلاً من الشركات. اليوم، مع Hermes 3 405B، تحقق هذا الهدف."

وصول مجاني لفترة محدودة

تقدم Lambda وصولاً مجانياً مؤقتاً إلى Hermes 3 عبر واجهة برمجة التطبيقات الخاصة بـ Chat Completions، المتوافقة مع واجهة برمجة التطبيقات OpenAI. يمكن للمستخدمين توليد مفتاح API سحابي من لوحة تحكم Lambda لاستكشاف قدرات النموذج بسهوله. بالإضافة إلى ذلك، توفر Lambda واجهة دردشة سهلة الاستخدام لاختبار وتعديل المطالبات في الوقت الحقيقي.

للوصول المخصص، يمكن نشر Hermes 3 على نقطة Lambda واحدة أو تكبيره لمزيد من التخصيص عبر بنية Lambda السحابية القابلة للتوسع.

مع استمرار تطور الذكاء الاصطناعي، يمثل Hermes 3 خطوة كبيرة إلى الأمام، مقدماً للمستخدمين تجربة ذكاء اصطناعي قوية وقابلة للتكيف ومركزية حول المستخدم.

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles