Inflection AI dévoile son nouveau modèle de chatbot Pi, rivalisant étroitement avec les performances de GPT-4.

Aujourd'hui, Inflection AI, la startup basée à Palo Alto cofondée par Mustafa Suleyman de DeepMind et Reid Hoffman de LinkedIn, a dévoilé son dernier modèle de base, Inflection-2.5.

S'appuyant sur son prédécesseur, Inflection-2.5 améliore considérablement les performances, rivalisant étroitement avec le GPT-4 d'OpenAI, notamment dans les matières STEM. Ce nouveau modèle alimente l’assistant Pi de l'entreprise, qui se positionne face à ChatGPT et Gemini, disponible sur des plateformes mobiles et web.

Progression dans la Compétition IA

Ce lancement représente un coup stratégique dans le paysage dynamique de l'IA, où les entreprises s'efforcent continuellement de défier la domination d'OpenAI. Récemment, Anthropic a lancé Claude 3 Opus, marquant une avancée significative en surpassant le GPT-4 en performances.

Inflection-2.5 : Aperçu des Performances

Depuis son lancement, Inflection AI a pour objectif de créer une IA « empathique, utile et sécurisée » offrant une expérience conversationnelle plus personnelle que d'autres modèles, y compris ceux de la série GPT. La nouvelle technique de perfectionnement empathique confère à Pi une personnalité unique et un quotient émotionnel (QE) élevé.

Avec Inflection-2.5, la startup cherche à renforcer le quotient intellectuel (QI) du modèle, particulièrement dans des domaines comme la physique et les mathématiques. Les utilisateurs peuvent désormais interagir avec Pi sur une vaste gamme de sujets, allant des passe-temps aux codages, travaux de biologie et planification d'affaires.

Performances sur Benchmark

Dans les évaluations de benchmark, Inflection-2.5 montre des améliorations significatives par rapport à Inflection-1 et réduit l'écart avec le GPT-4, bien qu'elle reste en retrait. Par exemple, sur le benchmark MMLU, qui évalue un éventail de tâches, Inflection-2.5 a obtenu un score de 85.5, juste en dessous des 87.3 de GPT-4. Dans les examens STEM, elle a enregistré 63 à l'examen de mathématiques hongrois contre 68 pour GPT-4 et atteint le 85ème percentile au GRE de physique, alors que GPT-4 a obtenu le 97ème percentile.

Dans le benchmark GSM8K, contenant 8 500 problèmes de mathématiques de qualité scolaire, Inflection-2.5 a obtenu 86.3, contre 92 pour GPT-4. Lors du test HumanEval en zero-shot, qui évalue les compétences en programmation, elle a reçu un score de 73.8 contre 79.3 pour GPT-4.

Formation Efficace et Capacités en Temps Réel

Bien qu'elle ne surpasse pas les performances de GPT-4, Inflection AI a souligné qu'Inflection-2.5 atteint « 94 % des performances de GPT-4 » avec un processus de formation plus efficace, n'utilisant que 40 % des capacités de calcul consacrées à GPT-4.

À l'instar de GPT-4, Inflection-2.5 intègre des capacités de recherche web en temps réel, fournissant aux utilisateurs des informations actualisées sur les événements récents, une avancée significative pour l'assistant Pi, conçu pour être accessible à tous. Toutefois, il est important de noter que la qualité des résultats obtenus sur le web peut varier, car aucun benchmark ne mesure cet aspect.

Comment Accéder à Inflection-2.5

Inflection AI a déjà intégré le nouveau modèle dans son chatbot Pi, permettant aux utilisateurs de tester ses capacités immédiatement. Bien que l'entreprise n'ait pas précisé les avantages spécifiques pour les utilisateurs issus de la mise à jour, elle a souligné un impact positif sur le sentiment des utilisateurs, l'engagement, la rétention et la croissance organique globale du chatbot.

Actuellement, le chatbot Pi, disponible sur Android, iOS, web et desktop, compte un million d'utilisateurs actifs quotidiens et six millions d'utilisateurs actifs mensuels, avec plus de quatre milliards de messages échangés et une durée moyenne de conversation de 33 minutes.

Most people like

Find AI tools in YBX