Google DeepMind Rentre dans la Course à l'IA Open Source avec le Lancement de son Nouveau Modèle Gemma

Aujourd'hui, Google DeepMind a annoncé le lancement de Gemma, ses nouveaux modèles d'IA open-source disponibles en versions de 2B et 7B paramètres. Ces modèles s'appuient sur les mêmes recherches et technologies que celles qui ont permis le développement des modèles Gemini récemment dévoilés.

Gemma sera disponible en variantes pré-entraînées et optimisées selon des instructions, accompagnées d'une licence commerciale permissive et d'un ensemble d'outils pour une IA générative responsable. De plus, Google DeepMind propose des chaînes d'outils pour l'inférence et le fine-tuning supervisé (SFT) compatibles avec les principaux frameworks : JAX, PyTorch et TensorFlow via Keras 3.0. Les développeurs peuvent accéder à des notebooks prêts à l'utilisation sur Colab et Kaggle, et Gemma est compatible avec Hugging Face, MaxText et NVIDIA NeMo. Les modèles pré-entraînés et optimisés peuvent être exécutés sur des ordinateurs portables, des stations de travail ou Google Cloud, avec des options de déploiement sur Vertex AI et Google Kubernetes Engine.

NVIDIA a également collaboré avec Google pour améliorer les optimisations sur toutes les plateformes d'IA NVIDIA, y compris les PC RTX AI locaux, afin d'améliorer les performances de Gemma.

Jeanine Banks, Vice-Présidente et Directrice Générale de Developer X chez Google, a souligné que les modèles Gemma représentent la continuité de l'engagement de Google envers la technologie open-source pour le développement de l'IA, s'appuyant sur des outils comme TensorFlow et JAX, ainsi que sur des modèles tels que PaLM2 et AlphaFold. Elle a mis en avant les insights récoltés durant le développement des modèles Gemini, révélant que les développeurs utilisent souvent à différentes étapes de leurs workflows des modèles open-source et des API. « Nous aspirons à être le seul fournisseur d'API et de modèles open-source, offrant la plus large gamme de capacités pour notre communauté », a déclaré Banks.

Tris Warkentin, Directeur de la gestion des produits chez Google DeepMind, a annoncé que l'entreprise publiera des benchmarks complets évaluant Gemma aux côtés d'autres modèles, qui seront accessibles sur les classements OpenLLM. « Nous collaborons avec NVIDIA et Hugging Face pour garantir que tous les benchmarks publics aient été réalisés sur ces modèles », a-t-il déclaré, exprimant sa fierté pour l'approche transparente et centrée sur la communauté adoptée durant le développement.

Gemma est décrite comme "responsable par conception". Warkentin a souligné que ces modèles ont été soumis à des évaluations approfondies pour garantir leur sécurité. Le communiqué de Google DeepMind a précisé que Gemma respecte les Principes d’IA, incorporant des techniques automatisées pour filtrer les informations personnelles des ensembles de données d'entraînement et utilisant l'apprentissage par renforcement grâce aux retours humains (RLHF) pour promouvoir un comportement responsable. Des évaluations rigoureuses, incluant des tests manuels et des tests adversariaux automatisés, ont été menées pour évaluer les profils de risque des modèles.

Warkentin a également insisté sur l'importance d'un écosystème ouvert pour favoriser une IA responsable. « Nous croyons que des perspectives diverses provenant de développeurs et de chercheurs du monde entier sont essentielles pour un retour d'information efficace et des systèmes de sécurité améliorés », a-t-il afirmé. « Intégrer ce retour d'information et cette communication avec la communauté est essentiel pour la valeur de ce projet. »

Most people like

Find AI tools in YBX

Related Articles
Refresh Articles