Cloudflare verbessert seine Plattform, indem es mehr Entwicklern ermöglicht, KI-Anwendungen von Hugging Face zu integrieren. Das Unternehmen hat auch seine serverlose, GPU-gestützte Inferenzlösung Workers AI weitreichend verfügbar gemacht.
Ursprünglich vor fast sieben Monaten angekündigt, vereinfacht die Cloudflare-Hugging Face-Integration die Bereitstellung von Modellen auf Workers AI. Mit nur einem Klick können Entwickler ihre Modelle sofort verteilen. Derzeit unterstützt Cloudflare vierzehn kuratierte Hugging Face-Modelle für Aufgaben wie Textgenerierung, Embeddings und Satzähnlichkeit.
„Der jüngste Anstieg in der generativen KI führt zu erheblichen Investitionen von Unternehmen in verschiedenen Branchen“, sagte Cloudflare-CEO Matthew Prince. „Während Demonstrationen einfach sind, ist der Übergang von KI in die Produktion deutlich herausfordernder. Wir möchten dies erleichtern, indem wir die Kosten und die Komplexität der Entwicklung von KI-gestützten Anwendungen minimieren.“
„Workers AI hebt sich als kostengünstige und zugängliche Option für die Inferenz hervor“, fuhr er fort. „In Partnerschaft mit Hugging Face, das unsere Vision der Demokratisierung von KI teilt, befähigen wir Entwickler, nahtlos ein Modell auszuwählen und ihre KI-Anwendungen weltweit sofort zu skalieren.“
Über Hugging Face können Entwickler ihr bevorzugtes Open-Source-Modell auswählen, „Deploy to Cloudflare Workers AI“ anklicken und es sofort verteilen. Dies gewährleistet eine Echtzeitbereitstellung an optimalen Standorten, beseitigt Verzögerungen und verbessert das Benutzererlebnis.
Hugging Face Mitgründer und CTO Julien Chaumond bemerkte: „Die Bereitstellung der beliebtesten Open-Models mit einer serverlosen API, unterstützt durch ein globales Netzwerk von GPUs, ist ein Wendepunkt für die Hugging Face-Community.“
Mit Workers AI können Entwickler GPUs in über 150 Städten weltweit nutzen, darunter Kapstadt, Durban, Johannesburg, Lagos, Amman, Buenos Aires, Mexiko-Stadt, Mumbai, Neu-Delhi und Seoul. Darüber hinaus verbessert Cloudflare die KI-Unterstützung für feinabgestimmte Modellgewichte, sodass Entwickler spezialisierte, domänenspezifische Anwendungen erstellen und bereitstellen können.