Google a lancé Gemini 1.5, la dernière version de son système d'IA conversationnelle, affichant des améliorations significatives en termes d'efficacité, de performance et de capacités de raisonnement sur de longs textes. Dans un article de blog, Demis Hassabis, responsable de Google AI, a souligné des améliorations architecturales clés permettant à Gemini 1.5 Pro d'égaler les performances du modèle le plus puissant de l'entreprise, Gemini 1.0 Ultra, tout en consommant moins de ressources informatiques. Ce dernier a été présenté la semaine dernière.
L'avancée la plus marquante est l'introduction d'une fenêtre de contexte d'un million de jetons, une avancée majeure dans la compréhension de contextes longs. Le modèle standard de Gemini peut analyser des invites dans un contexte de 128 000 jetons. Grâce à cette mise à niveau, Gemini 1.5 peut traiter un volume d'informations continu beaucoup plus important avant de générer une réponse.
Cette fenêtre d'un million de jetons permet un raisonnement élaboré. Sundar Pichai, PDG de Google, a mis en avant les capacités de Gemini 1.5 en montrant son aptitude à résumer l'intégralité du procès-verbal de la mission Apollo 11 ou à analyser un film muet de 44 minutes avec Buster Keaton. Hassabis a expliqué que le contexte élargi permet à Gemini 1.5 d'analyser, de classer et de résumer d'importants contenus de manière fluide. Les premiers résultats indiquent que la performance reste solide même avec ce contexte élargi.
À l'heure actuelle, la disponibilité publique de la version d'un million de jetons est incertaine. Google propose un aperçu limité à certains développeurs et utilisateurs d'entreprise via sa plateforme Vertex AI. Cette sortie fait suite au récent rebranding de l'IA conversationnelle de Google, passant de Bard à Gemini, ainsi qu'au lancement d'un niveau payant Gemini Advanced utilisant le modèle Ultra 1.0. Gemini se positionne comme un concurrent de ChatGPT Plus d'OpenAI.
Hassabis a noté que les améliorations d'efficacité dans Gemini 1.5 permettront aux équipes de Google d’"itérer, de former et de livrer des versions plus avancées de Gemini plus rapidement que jamais." Pichai a souligné l'engagement de Google à développer Gemini de manière responsable, conformément à ses principes en matière d'IA. L'entreprise a réalisé des tests éthiques et de sécurité approfondis pour Gemini 1.5, en mettant l'accent sur la sécurité du contenu et la représentation.
Le rythme des progrès en IA conversationnelle s'est considérablement accéléré depuis le lancement de ChatGPT l'année dernière. Les experts attribuent cela à la diminution des coûts de formation et à des innovations telles que l'architecture Sparsely-Gated Mixture-of-Experts de Google, qui facilite le développement rapide de nouvelles itérations. Avec Gemini 1.5, Google vise à consolider son leadership dans le secteur de l'IA. La question pressante demeure : quand ces capacités avancées de raisonnement sur longs contextes seront-elles intégrées dans les produits grand public de Google ?