تسهل DataStax تطوير تطبيقات الذكاء الاصطناعي التوليدي باستخدام واجهة برمجة البيانات المبتكرة.

DataStax تعزز تطوير الذكاء الاصطناعي التوليدي مع واجهة برمجة البيانات الجديدة

أطلقت DataStax واجهة برمجة بيانات جديدة تهدف إلى تبسيط إنشاء تطبيقات الذكاء الاصطناعي التوليدي المعزز بالتعافي (RAG) للمطورين. باعتبارها مزودًا رائدًا لقاعدة البيانات مفتوحة المصدر Apache Cassandra، تدعم DataStax قاعدة بيانات AstraDB السحابية كخدمة باستخدام هذه التكنولوجيا. في عام 2023، أضافت قدرات قاعدة البيانات المتجهة إلى منصتها، مما يضعها بجانب اللاعبين الرئيسيين في هذا المجال. وفي حدث مؤخر، أشار الرئيس التنفيذي لـ DataStax إلى Cassandra بثقة كنظام "القاعدة البيانات الأفضل للذكاء الاصطناعي التوليدي".

فتح قوة قواعد البيانات المتجهة

تعتبر قدرات قواعد البيانات المتجهة ضرورية لتطبيقات RAG التي تستفيد من نماذج اللغة الكبيرة (LLMs) ومنصات البيانات لإنتاج مخرجات دقيقة ومخصصة. قدمت DataStax قدرات المتجهات في AstraDB منذ يوليو 2023؛ ومع ذلك، كانت هذه تتطلب من المستخدمين التفاعل مع لغة استعلام Cassandra (CQL) لاستدعاء البيانات. تغير واجهة برمجة البيانات الجديدة هذه الديناميكية، مما يمكّن المطورين من استخدام Python وJavaScript للتفاعل مع قاعدة البيانات. تقوم هذه الخطوة بتحديث المشهد التنافسي، وتقرب DataStax من قواعد البيانات المتجهة المصممة لهذا الغرض مثل Pinecone، التي قدمت مؤخرًا وظائف بدون خوادم.

قال إيد أنوف، رئيس قسم المنتجات في DataStax: "كانت هناك صراعات بين قواعد البيانات المتجهة الأصلية التي تدعم استعلامات المتجهات فقط وقواعد البيانات الهجينة التي تبرع في نمذجة الاستعلامات. كان هدفنا هو سد هذه الفجوة، وهذا تمامًا ما تحققه واجهة البيانات."

تحويل تطوير تطبيقات RAG

على الرغم من أن واجهة برمجة التطبيقات الجديدة لا تقدم قدرات متجهة جديدة إلى AstraDB، إلا أنها تبسط عملية التطوير. أشار أنوف إلى أنه منذ بدء قدرات المتجهات، ركز حوالي نصف مستخدمي AstraDB الجدد على تطبيقات الذكاء الاصطناعي التوليدي. وكانت المشكلة أن هؤلاء المطورين يعتمدون بشكل أساسي على Python وJavaScript، التي لم تكن مدعومة للوصول إلى بيانات AstraDB.

قبل إطلاق واجهة برمجة التطبيقات، كان بناء تطبيقات الذكاء الاصطناعي يتطلب معرفة واسعة بـ CQL، مما يتطلب نمذجة بيانات معقدة تعيق تطوير تطبيقات RAG المباشرة. كما كانت الاستعلامات أقل تحسينًا لاسترجاع بيانات المتجهات.

تخفف واجهة برمجة البيانات الجديدة هذه المشكلات من خلال إدارة التوجيه بصورة تلقائية، وتقديم واجهة سهلة الاستخدام في Python وJavaScript، وتحسين الأداء من خلال التخزين الفعال وفهرسة بيانات المتجهات على مستوى قاعدة البيانات. مما يقلل من منحنى التعلم ويزيد من الأداء مقارنة باستخدام واجهات برمجة التطبيقات الحالية الخاصة بـ Cassandra.

تحديث تفاعل قواعد البيانات

تقوم واجهات برمجة التطبيقات التقليدية بترجمة لغات البرمجة مثل Python أو JavaScript إلى لغة استعلام قاعدة البيانات، وهي ممارسة تشبه أساليب ربط الكائنات العلائقية القديمة (ORM). تميز واجهة بيانات DataStax نفسها من خلال بنية Cassandra الفريدة، التي تسهل الروابط الأعمق داخل قاعدة البيانات، مما يؤدي إلى تحسين أداء الاستعلام.

وأوضح أنوف: "تقدم واجهة البيانات للمطورين تنسيق بيانات بسيط يعتمد على JSON. يمكن إرسال أي شيء قابل للتعبير في JSON إلى قاعدة البيانات واسترجاعه منها." "نقوم بتخزين ذلك بكفاءة في Cassandra، مما يحافظ على الأداء الأمثل."

تعزيز البحث المتجه مع JVector

تشكل محرك البحث JVector جزءًا أساسيًا من تقدم DataStax في قواعد البيانات المتجهة، وهو أداة مفتوحة المصدر مدمجة في AstraDB. أشار أنوف إلى أن JVector يستخدم DiskANN، وهو إصدار محسن للأقراص من خوارزمية البحث عن أقرب الجيران التقريبية (ANN). تعزز هذه الاستراتيجية أداء الاسترجاع بشكل كبير، خاصة على نطاق واسع.

تؤكد DataStax أن محرك JVector يمكّن AstraDB من تقديم أعلى مستوى من الصلة والاسترجاع مقارنةً بقواعد البيانات المتجهة الأخرى. يتم فتح الكثير من تطوير DataStax المستمر للمتجهات، بما في ذلك JVector وواجهة البيانات الجديدة، لمجتمع Cassandra وعملاء AstraDB.

قال أنوف: "نحن ملتزمون بقوة بتوفير الموارد لبيئات البرمجيات مفتوحة المصدر. هدفنا هو التأكد من أن المطورين لديهم أسهل طريق عند اختيار خدمة سحابية."

Most people like

Find AI tools in YBX