Cloudflare améliore sa plateforme en permettant à un plus grand nombre de développeurs d'intégrer des applications d'IA de Hugging Face. L'entreprise a également rendu largement accessible sa solution d'inférence sans serveur alimentée par GPU, Workers AI.
Annoncée il y a près de sept mois, l'intégration Cloudflare-Hugging Face simplifie le déploiement des modèles sur Workers AI. En un seul clic, les développeurs peuvent instantanément distribuer leurs modèles. À l'heure actuelle, Cloudflare supporte quatorze modèles Hugging Face soigneusement sélectionnés pour des tâches telles que la génération de texte, les embeddings et la similitude des phrases.
"Le récent essor de l'IA générative entraîne un investissement significatif de la part d'entreprises de divers secteurs," a déclaré le PDG de Cloudflare, Matthew Prince. "Bien que les démonstrations soient simples, passer l'IA en production est nettement plus complexe. Nous visons à alléger ce processus en réduisant le coût et la complexité du développement d'applications alimentées par l'IA."
"Workers AI se distingue comme une option abordable et accessible pour l'inférence," a-t-il poursuivi. "En partenariat avec Hugging Face, qui partage notre vision de démocratiser l'IA, nous permettons aux développeurs de sélectionner facilement un modèle et de faire évoluer leurs applications d'IA à l'échelle mondiale, en un instant."
Grâce à Hugging Face, les développeurs peuvent choisir leur modèle open-source préféré, sélectionner "Déployer sur Cloudflare Workers AI", et le distribuer instantanément. Cela garantit une livraison en temps réel dans des emplacements optimaux, éliminant ainsi le délai et améliorant l'expérience utilisateur.
Julien Chaumond, co-fondateur et CTO de Hugging Face, a déclaré : "Fournir les modèles open-source les plus populaires avec une API sans serveur, soutenue par un réseau mondial de GPU, est une véritable révolution pour la communauté Hugging Face."
Avec Workers AI, les développeurs peuvent tirer parti de GPU situés dans plus de 150 villes à travers le monde, notamment Cape Town, Durban, Johannesburg, Lagos, Amman, Buenos Aires, Mexico, Mumbai, New Delhi et Séoul. De plus, Cloudflare renforce le soutien à l'IA pour les poids de modèles finement ajustés, permettant aux développeurs de créer et déployer des applications spécialisées et spécifiques à un domaine.