استضافت OpenAI مؤتمر DevDay يوم الثلاثاء بنسخة أكثر تحفظًا، تاركةً وراءها إطلاق المنتجات البارزة في العام الماضي لتركيز جهودها على التحسينات التدريجية في أدواتها وواجهات برمجة التطبيقات (APIs) الخاصة بالذكاء الاصطناعي. أكد الحدث لعام 2024 على تمكين المطورين وتسليط الضوء على قصص المجتمع، مما يعكس تحوُّلاً استراتيجياً في مشهد الذكاء الاصطناعي الذي يتسم بالتنافس المتزايد.
4 ابتكارات رئيسية تم الكشف عنها
قدّم المؤتمر أربعة ابتكارات رئيسية تهدف إلى تحسين تجربة المطورين: ضبط دقة الرؤية، واجهة برمجة التطبيقات في الوقت الحقيقي، تقطير النماذج، وتخزين سياقات الاستعلام. تشير كل أداة إلى التزام OpenAI بتعزيز بيئة المطورين بدلاً من التنافس مباشرة في قطاع تطبيقات المستخدم النهائي.
تخزين سياقات الاستعلام: تطوير بتكاليف منخفضة
تعتبر ميزة تخزين سياقات الاستعلام من العناصر البارزة، حيث تم تصميمها لتقليل التكاليف والزمن المستغرق للمطورين. توفر هذه النظام خصمًا بنسبة 50% على الرموز التي تمت معالجتها مؤخرًا، مما يتيح توفيرًا كبيرًا في التطبيقات التي تعيد استخدام السياقات بشكل متكرر. أشار أوليفييه جودمان، رئيس منتج OpenAI للمنصة، إلى أن التكاليف انخفضت بنسبة تصل إلى 1000x خلال عامين فقط، مما يمكّن الشركات الناشئة والمؤسسات من استكشاف إمكانيات جديدة كانت مكلفة سابقًا.
تظهر جداول الأسعار من DevDay 2024 تخفيضات كبيرة في تكاليف استخدام نماذج الذكاء الاصطناعي، مع توفير يصل إلى 50% للرموز المخزنة مقارنة بنظيراتها غير المخزنة. كما يقدم النموذج الجديد o1 أسعارًا متميزة تعكس قدراته المحسنة.
ضبط دقة الرؤية: تقدم في الذكاء الاصطناعي البصري
تمكن ميزة ضبط دقة الرؤية في نموذج GPT-4o المطورين من تخصيص فهم النموذج للرؤية باستخدام النصوص والصور. لهذا التقدم آثار بعيدة الأمد على صناعات مثل السيارات ذاتية القيادة، الصور الطبية، والبحث البصري. على سبيل المثال، حسّنت خدمة Grab، التي تُعَدّ من خدمات توصيل الطعام والتنقل الرئيسية في جنوب شرق آسيا، خدمات الخرائط باستخدام هذه التكنولوجيا. مع 100 مثال تدريبي فقط، حققت Grab تحسينًا بنسبة 20% في دقة عد حارات المرور وزيادة بنسبة 13% في تحديد مواقع علامات السرعة.
واجهة برمجة التطبيقات في الوقت الحقيقي: تعزيز الذكاء الاصطناعي المحادثي
أطلقت OpenAI أيضًا واجهة برمجة التطبيقات في الوقت الحقيقي، التي دخلت المرحلة التجريبية العامة، مما يمكّن المطورين من إنشاء تطبيقات صوتية متعددة الوسائط ذات زمن استجابة منخفض. يتيح ذلك دمج الأوامر الصوتية في التطبيقات بسلاسة، مما يعزز تفاعل المستخدم. عرضت OpenAI نسخة مطوّرة من Wanderlust، حيث يمكن للمستخدمين التحدث بشكل طبيعي مع التطبيق للتخطيط لرحلاتهم، حتى في منتصف الحديث، mimicking محادثة إنسانية.
تفتح واجهة برمجة التطبيقات في الوقت الحقيقي فرصًا في مجالات متعددة، بما في ذلك خدمة العملاء والتعليم. قام المستخدمون الأوائل مثل Healthify وSpeak بدمجها، مما حسن تجارب المستخدمين في الرعاية الصحية وتعلم اللغات. على الرغم من أن تسعير واجهة برمجة التطبيقات هو 0.06 دولار لكل دقيقة من إدخال الصوت و0.24 دولار لكل دقيقة من إخراج الصوت، إلا أنها تمثل استثمارًا قيمًا للمطورين الذين يسعون لبناء تطبيقات تركز على الصوت.
تقطير النماذج: جعل الذكاء الاصطناعي أكثر سهولة
يمكن أن يمثل إعلان تقطير النماذج نقطة تحوّل، مما يتيح للمطورين استخدام نواتج من نماذج متقدمة مثل o1-preview وGPT-4o لتعزيز نماذج أكثر كفاءة مثل GPT-4o mini. تمكّن هذه العملية الشركات الصغيرة، مثل startups في مجال التقنية الطبية، من الاستفادة من قدرات النماذج المتقدمة دون تحمل نفس تكاليف الحوسبة، مما يحسن النتائج الصحية في المناطق الأقل خدمة.
تحول OpenAI الاستراتيجي: التركيز على النمو المستدام
يمثل DevDay 2024 لدى OpenAI تحولًا استراتيجيًا نحو تعزيز نظام بيئي مستدام للذكاء الاصطناعي بدلاً من السعي وراء إطلاق المنتجات الجاذبة للأنظار. في حين قد يبدو هذا النهج أقل إثارة للرأي العام، إلا أنه يعكس فهمًا دقيقًا لمشهد الذكاء الاصطناعي المتطور، حيث احتدم التنافس وزادت المخاوف بشأن توفر البيانات.
على عكس الإعلانات الرائدة لعام 2023، يركز هذا العام على تحسين الأدوات وتمكين المطورين، مما يظهر هدف OpenAI في الحفاظ على ميزة تنافسية مع تقليل كثافة الموارد وتأثيرها البيئي. مع تحول OpenAI من disruptor إلى مزود منصة، سيتوقف نجاحها على المدى الطويل على تعزيز نظام بيئي قوي للمطورين. من خلال تقديم أدوات محسّنة وتخفيضات في التكاليف ودعم أفضل، تؤسس OpenAI الأساس لاعتماد الذكاء الاصطناعي المستدام عبر العديد من الصناعات.