أطلقت Google Cloud إصدارين من نموذج الذكاء الاصطناعي الرائد لديها: Gemini 1.5 Flash وGemini 1.5 Pro. يتميز Gemini 1.5 Flash بأنه نموذج متعدد الوسائط مضغوط يوفر نافذة سياق تضم 1 مليون رمز، مصمم للمهام عالية التردد. تم الكشف عنه لأول مرة في مايو خلال Google I/O، وهو متاح الآن للمطورين. أما Gemini 1.5 Pro الأكثر قوة، الذي تم تقديمه في فبراير، فيحتوي على نافذة سياق رائعة تصل إلى 2 مليون رمز، مما يجعله الإصدار الأكثر تقدمًا من نماذج اللغة الكبيرة في Google حتى الآن.
تظهر إطلاق هذه النسخ من Gemini كيف يمكن لتكنولوجيا الذكاء الاصطناعي من Google أن تمكّن الشركات من إنشاء وكلاء وحلول مبتكرة. خلال مؤتمر صحفي مؤخر، أشار المدير التنفيذي لـ Google Cloud، توماس كوريان، إلى "الزخم الهائل" في اعتماد الذكاء الاصطناعي التوليدي، مشيرًا إلى أن مؤسسات كبرى - بما في ذلك Accenture وAirbus وGoldman Sachs - تبني على منصة Google. ويعزى هذا الازدهار إلى قدرات نماذج Google جنبًا إلى جنب مع منصة Vertex، مما يعد بتقدم سريع في كلا المجالين.
Gemini 1.5 Flash
يتيح Gemini 1.5 Flash للمطورين Latency منخفض وأسعار فعالة من حيث التكلفة، مع نافذة سياق مثالية لتطبيقات مثل وكلاء الدردشة في مجال تجارة التجزئة ومعالجة الوثائق. تدعي Google أن Gemini 1.5 Flash يعمل بشكل أسرع بنسبة 40% في المتوسط مقارنة بـ GPT-3.5 Turbo عند معالجة مدخلات تتكون من 10,000 رمز. بالإضافة إلى ذلك، يقدم تكلفة إدخال أقل بأربع مرات من نموذج OpenAI ويدعم تخزين السياق للمدخلات التي تتجاوز 32,000 رمز.
Gemini 1.5 Pro
يتضمن Gemini 1.5 Pro نافذة سياق فريدة بحجم 2 مليون رمز، مما يسمح له بتحليل نصوص أكبر وإنتاج استجابات شاملة. يوضح كوريان أن هذه الميزة تعني أن المستخدمين يمكنهم إدخال محتوى ضخم، مثل فيديو عالي الدقة مدته ساعتان أو أكثر من 60,000 سطر من التعليمات البرمجية، دون الحاجة إلى تقسيمه إلى أجزاء أصغر. العديد من الشركات تكتشف بالفعل قيمة كبيرة من القوة المعالجة المعززة لهذا النموذج.
ويوضح كوريان أيضًا الفرق بين النموذجين بناءً على احتياجات المستخدمين: يعد Gemini 1.5 Pro مثاليًا لمعالجة المحتوى الطويل، بينما يعد Flash أفضل لتطبيقات اللاتنسي المنخفض.
تخزين السياق لـ Gemini 1.5
لمساعدة المطورين على تحقيق أقصى استفادة من نوافذ السياق لـ Gemini، تقوم Google بإدخال ميزة تخزين السياق، المتاحة الآن في العرض العام لكلا النموذجين. تتيح هذه الميزة للنماذج تخزين وإعادة استخدام المعلومات التي تمت معالجتها سابقًا، مما يقلل بشكل كبير من التكاليف الحسابية - بما يصل إلى 75% - حيث يلغي الحاجة إلى إعادة حساب الاستجابات للمحادثات أو الوثائق الطويلة.
معدل التدفق المخصص لـ Gemini
تتيح ميزة معدل التدفق المخصص الجديدة للمطورين توسيع استخدام نماذج Gemini بفاعلية من خلال إدارة عدد الاستفسارات التي يمكن أن يتعامل معها النموذج بمرور الوقت. توفر هذه الخيار توقعًا وموثوقية أكبر مقارنة بنموذج الدفع حسب الاستخدام السابق. أشار كوريان إلى أن معدل التدفق المخصص يسمح للعملاء بحجز سعة الاستدلال، مما يضمن أداءً متسقًا حتى خلال الارتفاعات في الطلب، مثل تلك التي تواجهها منصات وسائل التواصل الاجتماعي أثناء الأحداث الكبرى.
معدل التدفق المخصص متاح الآن بشكل عام، مما يوفر للمطورين تحكمًا أكبر على أحمال العمل الإنتاجية وضمانات مستوى الخدمة فيما يتعلق بأوقات الاستجابة ومدة التشغيل.