ميكروسوفت تكشف عن عرض "MInference" لثورة معايير معالجة الذكاء الاصطناعي

Home أخبار الذكاء الاصطناعي ميكروسوفت تكشف عن عرض "MInference" لثورة معايير معالجة الذكاء الاصطناعي

Updated on يوليو 8 2024

أزاحت Microsoft الستار مؤخرًا عن تكنولوجيا MInference المبتكرة على منصة الذكاء الاصطناعي Hugging Face، معلنة عن تقدم كبير في سرعة معالجة نماذج اللغة الكبيرة. تتيح هذه العرض التفاعلي، المدعوم من Gradio، للمطورين والباحثين استكشاف أحدث قدرات Microsoft في التعامل مع المدخلات النصية الطويلة مباشرةً في متصفحات الويب.

MInference، والتي تعني "استدلال بمليون رمز"، تهدف إلى تسريع مرحلة "التعبئة المسبقة" في معالجة نماذج اللغة، وهي مرحلة غالبًا ما تعاني من اختناق عندما تتعامل مع نصوص واسعة. أفاد الباحثون في Microsoft أن MInference يمكن أن يقلل وقت المعالجة بنسبة تصل إلى 90% لمدخلات تتكون من مليون رمز (ما يعادل حوالي 700 صفحة)، مع الحفاظ على الدقة.

سلط الباحثون الضوء على قضية حاسمة في ورقتهم المنشورة على arXiv، حيث قالوا: "التحديات الحسابية لاستدلال نماذج اللغة الكبيرة تبقى عائقًا كبيرًا أمام انتشارها الواسع، خاصةً مع زيادة طول الطلبات. بسبب التعقيد التربيعي لحساب الانتباه، يحتاج نموذج LLM بوزن 8 مليارات إلى 30 دقيقة لمعالجة طلب يتكون من مليون رمز على وحدة معالجة الرسوميات Nvidia A100 واحدة. فعاليات MInference تقلل من زمن الاستدلال حتى 10 مرات للتعبئة المسبقة على A100، مع الحفاظ على الدقة."

كما عرض العرض التفاعلي مقارنة في الأداء بين نموذج LLaMA-3-8B-1M القياسي وإصدار MInference المحسن، حيث أظهر تسريعًا كبيرًا في زمن الاستجابة بمعدل 8.0 أضعاف. على سبيل المثال، تم تخفيض معالجة 776,000 رمز من 142 ثانية إلى 13.9 ثانية على وحدة معالجة الرسوميات Nvidia A100 بسعة 80GB.

تتناول طريقة MInference المبتكرة أحد التحديات الرئيسية في صناعة الذكاء الاصطناعي: الحاجة المتزايدة لمعالجة مجموعات بيانات أكبر ونصوص أطول بكفاءة. مع تطور نماذج اللغة في الحجم والقدرة، تصبح قدرتها على التعامل مع السياقات الواسعة أمرًا حيويًا لمجموعة متنوعة من التطبيقات، بدءًا من تحليل الوثائق وصولاً إلى الذكاء الاصطناعي التفاعلي.

يعكس العرض التفاعلي تحولًا في نشر وبحث الذكاء الاصطناعي. من خلال توفير وصول مباشر إلى التكنولوجيا، تمكن Microsoft المجتمع الأوسع للذكاء الاصطناعي من تقييم قدرات MInference بشكل مباشر. قد تسرع هذه الاستراتيجية من تحسين واعتماد التكنولوجيا، مما يعزز التقدم السريع في معالجة الذكاء الاصطناعي بكفاءة.

ومع ذلك، تتجاوز تداعيات MInference تحسينات السرعة. فإن قدرتها على معالجة أجزاء محددة من المدخلات الطويلة تثير اعتبارات مهمة بشأن الاحتفاظ بالمعلومات والتحيزات المحتملة. بينما يؤكد الباحثون على الدقة، من الضروري القيام بتمحيص لتحديد ما إذا كانت هذه الآلية الانتخابية قد تعطي الأولوية لأنواع معينة من المعلومات على أخرى، مما قد يؤثر على فهم النموذج أو مخرجاته بطرق دقيقة ولكنها مهمة.

علاوة على ذلك، فإن آلية الانتباه الديناميكي المتناثر لـ MInference يمكن أن تؤثر بشكل كبير على استهلاك الطاقة في الذكاء الاصطناعي. من خلال تقليل المتطلبات الحسابية المرتبطة بمعالجة النصوص الطويلة، قد تسهم هذه التكنولوجيا في جعل نماذج اللغة الكبيرة أكثر استدامة بيئيًا، استجابةً للقلق المتزايد حول بصمة الكربون للذكاء الاصطناعي وتوجيه الأبحاث المستقبلية في هذا المجال.

كما أن إدخال MInference يعزز التنافس بين عمالقة التكنولوجيا في مجال أبحاث الذكاء الاصطناعي. مع سعي الشركات المختلفة لتعزيز الكفاءة لنماذج اللغة الكبيرة، يعزز عرض Microsoft العام ريادتها في هذا المجال الحيوي من التطوير. وبالتالي، قد يدفع ذلك المنافسين لتسريع جهودهم البحثية، مما يمهد الطريق لتقدم سريع في تقنيات معالجة الذكاء الاصطناعي بكفاءة.

بينما يبدأ الباحثون والمطورون في استكشاف MInference، لم يتضح بعد مدى تأثيرها الكامل على المجال. ومع ذلك، فإن إمكانياتها لتقليل التكاليف الحسابية واستهلاك الطاقة بشكل ملحوظ تجعل تكنولوجيا Microsoft الجديدة خطوة حاسمة نحو حلول ذكاء اصطناعي أكثر كفاءة وإتاحة. في الأشهر المقبلة، من المتوقع أن تخضع MInference لتمحيص واختبار شاملين عبر تطبيقات متنوعة، مما سيوفر رؤى قيمة حول أدائها في العالم الحقيقي وتأثيراتها على مستقبل الذكاء الاصطناعي.

هجوم الذكاء الاصطناعي: اتقن عالم التكنولوجيا التوليدية

هيبيا تأمن 130 مليون دولار لإنشاء منصة رائدة في مجال استرجاع المعرفة باستخدام الذكاء الاصطناعي.

Most people like

Instant Virtual Staging

101.3K

حوّل قوائمك مع تطبيق التهيئة الافتراضية المدعوم بالذكاء الاصطناعي لمهنيي العقارات اكتشف كيف يمكن لتطبيقنا المبتكر للتهيئة الافتراضية المعتمد على الذكاء الاصطناعي أن يرتقي بقوائم عقاراتك. مصمم خصيصًا لمهنيي العقارات، يتيح لك هذا الأداة القوية إنشاء تصورات مذهلة وواقعية تأسر المشترين المحتملين وتعزز جاذبية الممتلكات. حسن استراتيجيتك التسويقية وتفوق في سوق تنافسي مع تقنيتنا المتطورة المصممة لتبسيط عملية عرض الممتلكات الخاصة بك.

التصميم الافتراضي AI Photo & Image Generator

Docsie

16.7K

نقدم لكم أداة ويب سهلة الاستخدام مصممة لإنشاء وإدارة وثائق المنتجات وقواعد المعرفة بكل يسر. قم بتحسين سير العمل الخاص بك وزيادة أداء فريقك من خلال هذه الحلول البديهية.

قاعدة المعرفة AI Knowledge Base

Vast.ai

408.9K

منصة إيجار وحدات معالجة الرسوميات السحابية بأسعار معقولة للأداء المثالي تزايد الطلب على موارد الحوسبة عالية الأداء بشكل كبير في المشهد الرقمي اليوم، مما يجعل إيجارات وحدات معالجة الرسوميات السحابية خيارًا جذابًا للشركات والمطورين. تقدم منصتنا حلاً اقتصاديًا للوصول إلى قدرات GPU القوية، مما يتيح لك تعزيز مشاريعك دون التكلفة العالية المرتبطة عادةً بالأجهزة التقليدية. استمتع بالتوسع والمرونة السلسة مع إيجارات وحدات معالجة الرسوميات السحابية منخفضة التكلفة، مصممة لتلبية احتياجاتك المحددة وزيادة إنتاجيتك.

إيجار وحدة معالجة الرسوميات السحابية Other

ChatSweetie: Best AI Girlfriend Chat

124K

ابدأ محادثتك مع صديقتك الذكية في ChatSweetie اليوم! صمم شخصيتك الذكية الفريدة بسهولة في بضع دقائق فقط.

روبوت الدردشة الذكي AI Girlfriend

Find AI tools in YBX