Lors de la conférence des développeurs Google I/O de cette semaine, Google a dévoilé son dernier modèle d'intelligence artificielle : Gemini 1.5 Flash. Ce modèle, optimisé pour la vitesse et l'efficacité, repousse les limites de l'IA tout en répondant aux besoins des développeurs en matière d'outils d'IA légers, économiques et puissants.
Demis Hassabis, PDG de Google DeepMind, a souligné la performance exceptionnelle de Gemini 1.5 Flash dans diverses applications, notamment la synthèse, les fonctions de chat, le sous-titrage d'images et de vidéos, ainsi que l'extraction de données à partir de documents longs et de tableurs. Ce nouveau modèle bénéficie d'un processus de « distillation » qui transfère des connaissances et des compétences essentielles de Gemini 1.5 Pro vers un design plus compact, établissant un équilibre entre architecture légère et capacités robustes.
Malgré sa taille réduite, Gemini 1.5 Flash partage la même fonctionnalité multimodale que son homologue Pro, avec une fenêtre de contexte longue pouvant traiter jusqu'à 1 million de tokens. Cela lui permet d'analyser des documents comportant jusqu'à 1 500 pages ou plus de 30 000 lignes de code en une seule exécution, offrant une commodité sans précédent pour les développeurs.
Gemini 1.5 Flash est conçu pour les développeurs, leur permettant de créer des produits et services d'IA plus rapidement et de manière économique. De plus, Google a amélioré Gemini 1.5 Pro, renforçant ses capacités en matière de codage, de raisonnement et d'analyse audio-visuelle. Fait intéressant, Google prévoit de doubler la fenêtre de contexte du modèle existant à 2 millions de tokens plus tard cette année, lui permettant de traiter 2 heures de vidéo, 22 heures d'audio, plus de 60 000 lignes de code ou plus de 1,4 million de mots de contenu simultanément.
Actuellement, les versions Gemini 1.5 Flash et Pro sont disponibles en avant-première dans Google AI Studio et Vertex AI. Google a également lancé une nouvelle version de son modèle ouvert, Gemma 2. Ces mises à jour s'adressent principalement aux développeurs et aux utilisateurs intéressés par la création d'applications d'IA, ce qui réduit les chances que les consommateurs ordinaires en bénéficient directement.
Le lancement de Gemini 1.5 Flash réaffirme l'innovation de Google dans le secteur de l'IA, offrant aux développeurs des outils puissants et flexibles pour faire progresser les futurs produits et services d'IA.