Jeudi, OpenAI a lancé une version plus compacte et économique de son modèle phare de langage, baptisée GPT-4o mini. Ce modèle permet aux développeurs de créer des applications et des services alimentés par l'IA à un coût réduit de 60 % par rapport au précédent modèle le plus petit, GPT-3.5 Turbo. Plus important encore pour les utilisateurs, le GPT-4o mini remplacera immédiatement le GPT-3.5 Turbo pour les utilisateurs gratuits de ChatGPT, améliorant ainsi leur expérience globale.
Le GPT-4o mini a obtenu un score impressionnant de 82 % sur le benchmark MMLU, qui évalue la compréhension du langage multitâche massif à travers 16 000 questions couvrant 57 sujets académiques. Bien que ce score soit légèrement inférieur aux 88,7 % de GPT-4o, il surpasse de manière significative les 70 % de GPT-3.5 Turbo. Bien que les experts déconseillent de se fier uniquement à ces benchmarks pour évaluer l'intelligence de l'IA, ils restent une métrique essentielle pour mesurer la performance des modèles de langage de grande taille.
L'introduction de versions réduites de modèles offre aux développeurs une flexibilité accrue dans la création d'applications IA, répondant ainsi aux besoins de ceux qui n'ont pas besoin ou ne peuvent se permettre d'accéder aux modèles les plus puissants dans chaque situation. En mai, Google a présenté son modèle Gemini 1.5 Flash, un modèle léger optimisé pour la vitesse et l'efficacité, rejoignant d'autres entreprises comme Anthropic qui ont également lancé des versions allégées de leurs modèles.
Actuellement, le GPT-4o mini peut traiter et générer à la fois du texte et des images, avec des projets d'intégration future de contenus audio et vidéo. Tandis que le GPT-3.5 Turbo sera progressivement retiré de ChatGPT, les développeurs peuvent encore l'utiliser via l'API d'OpenAI pour leurs applications jusqu'à son retrait complet.