يمكن أن تعزز إمكانية الوصول الإقليمي لنماذج اللغة الكبيرة (LLMs) بشكل ملحوظ من الميزة التنافسية، حيث يتيح الوصول الأسرع الابتكار بشكل أسرع. وعلى العكس، فإن الانتظار قد يعرض المتأخرين للخطر.
لكن السرعة المتزايدة في تطوير الذكاء الاصطناعي غالبًا ما تضطر المؤسسات إلى تأجيل الاعتماد حتى تصبح النماذج متاحة في تقنياتها. وعادة ما يحدث هذا التأخير بسبب قيود الموارد، والانحيازات الغربية، والتحديات متعددة اللغات.
لمعالجة هذه القضية الملحة، أعلنت Snowflake عن توفر الاستدلال عبر المناطق على Cortex AI. من خلال إعداد بسيط، يمكن للمطورين الآن معالجة الطلبات في مناطق مختلفة، حتى وإن لم تتوفر نموذج معين محليًا. يتيح ذلك دمج نماذج LLM الجديدة بسلاسة عند توافرها.
يمكن للمؤسسات استخدام LLMs بأمان عبر الولايات المتحدة، والاتحاد الأوروبي، ومنطقة آسيا والمحيط الهادئ واليابان (APJ) دون تكبد رسوم إضافية.
يقول أرون أغاروال، الذي يقود تسويق منتجات الذكاء الاصطناعي في Snowflake، "يتيح الاستدلال عبر المناطق على Cortex AI دمجًا سلسًا مع LLM الذي تختاره، بغض النظر عن توافره الإقليمي."
تمكين الاستدلال عبر المناطق
يجب تمكين وظيفة العبور بين المناطق لتسهيل نقل البيانات، حيث تكون الإعدادات معطلة بشكل افتراضي. يجب على المطورين تحديد المناطق للاستدلال. إذا كانت كلا المنطقتين تعملان تحت خدمات أمازون ويب (AWS)، ستعبر البيانات بأمان عبر شبكة AWS العالمية، مستفيدة من تشفير الطبقة الفيزيائية التلقائي. إذا كانت مقدمي الخدمات السحابية مختلفين، ستنتقل البيانات عبر الإنترنت العام باستخدام أمان النقل المتبادل المشفّر (MTLS). من المهم أن المدخلات والمخرجات والمحاثات التي ينتجها الخدمة لا تُخزَّن أو تُخزَّن مؤقتًا؛ ويتم معالجة الاستدلال فقط في بيئة العبور بين المناطق.
لتوليد الردود بأمان ضمن إطار عمل Snowflake، يجب على المستخدمين أولاً ضبط معلمة على مستوى الحساب لتحديد مكان الاستدلال. بعد ذلك، يقوم Cortex AI تلقائيًا بتحديد المنطقة المناسبة لمعالجة الطلب عندما لا تكون LLM المطلوبة متاحة في المنطقة المصدر.
على سبيل المثال، إذا قام المستخدم بتعيين معلمة إلى "AWSUS"، يمكن أن يحدث الاستدلال في أي من منطقتي الساحل الشرقي أو الغربي للولايات المتحدة. بدلاً من ذلك، فإن تعيين "AWSEU" يمكّن من توجيه الطلب إلى منطقة وسط الاتحاد الأوروبي أو شمال شرق آسيا والمحيط الهادئ. حاليًا، يمكن تكوين المناطق المستهدفة فقط ضمن AWS؛ وإذا تم تمكين العبور بين المناطق في Azure أو Google Cloud، ستظل الطلبات تتم معالجتها عبر AWS.
يوضح أغاروال هذا بمثال يتضمن Snowflake Arctic. إذا كان النموذج غير متوفر في المنطقة المصدر (AWS الساحل الشرقي للولايات المتحدة)، يقوم الاستدلال عبر المناطق بتوجيه الطلب إلى AWS الساحل الغربي للولايات المتحدة 2، ويتم إرجاع الرد إلى المنطقة الأصلية.
يعلق أغاروال قائلاً، "يمكن القيام بكل هذا من خلال سطر واحد من الشفرة."
يتحمل المستخدمون تكاليف استخدام LLM في المنطقة المصدر وليس في المنطقة المتجاوزة. تؤثر زمن الانتقال بين المناطق على البنية التحتية وظروف الشبكة، لكن Snowflake تتوقع أن يكون هذا الزمن ضئيلًا مقارنةً بزمن استدلال LLM.