Deux nouvelles fonctionnalités passionnantes arrivent sur Google AI Studio, répondant à une demande clé des développeurs. Cette plateforme de prototypage et d'expérimentation avec des modèles d'apprentissage automatique intègre désormais l'extraction native de frames vidéo et le caching de contexte. La fonctionnalité d'extraction de frames vidéo est disponible dès aujourd'hui, tandis que le caching de contexte sera bientôt ajouté à l'API Gemini.
Avec l'extraction de frames vidéo, les développeurs peuvent utiliser des vidéos téléchargées sur leurs applications, permettant à Gemini de capturer des frames individuelles ou des séquences d'images. Cette fonctionnalité améliore la capacité de l'IA à interpréter des scènes, à générer des résumés concis et à enrichir l'expérience utilisateur. Vous pouvez trouver cette capacité d'extraction de frames vidéo ajustable dans l'API Gemini.
Le caching de contexte permet aux développeurs gérant de grands ensembles d'informations de stocker des contextes fréquemment accessibles, ce qui réduit les coûts et optimise les flux de travail. Au lieu d'envoyer des fichiers à Gemini de manière répétée, les développeurs peuvent les envoyer une seule fois. Google souligne l'utilité du caching de contexte dans divers scénarios, tels que le brainstorming d'idées de contenu, l'analyse de documents complexes et le résumé de travaux de recherche et de matériaux de formation. Cette fonctionnalité sera prise en charge dans l'API Gemini à sa sortie.
Ces mises à jour font partie d'une série d'annonces passionnantes concernant Gemini lors de la conférence des développeurs de Google, aux côtés du lancement de Gemini 1.5 Flash, d'un nouveau modèle Gemma 2, et d'une variante pré-entraînée appelée PaliGemma.