Les chercheurs de l'Université de Chicago ont révélé que les modèles de langage de grande taille (LLMs), tels que GPT-4 d'OpenAI, peuvent analyser des états financiers avec une précision comparable, voire supérieure, à celle des analystes financiers professionnels. Leurs résultats, détaillés dans le document de travail intitulé « Analyse des États Financiers avec des Modèles de Langage de Grande Taille », soulignent des implications significatives pour l'avenir de l'analyse financière et de la prise de décision.
Dans leur étude, les chercheurs ont évalué la capacité de GPT-4 à prédire la croissance des bénéfices des entreprises en analysant des bilans et des comptes de résultat standardisés et anonymisés, sans aucun contexte textuel. Fait remarquable, GPT-4 a surpassé les analystes humains dans cette tâche.
Les auteurs ont noté : « Nous constatons que la précision de la prédiction des LLM est comparable à celle d'un modèle d'apprentissage automatique de pointe, étroitement entraîné. » Ils ont souligné que le succès du LLM ne dépend pas uniquement de ses données d'entraînement, mais également de sa capacité à générer des récits perspicaces concernant la performance future d'une entreprise.
GPT-4 a atteint un score de précision notable de 60,4 %, avec un score F1 de 60,9 %, grâce à une approche novatrice combinant des données financières structurées avec des invites de « chaîne de pensée ». Ces prompts aident l'IA à imiter le processus de raisonnement des analystes humains, lui permettant d'identifier des tendances, de calculer des ratios et de synthétiser des informations pour élaborer des prédictions. Cette méthode a conduit à une amélioration significative par rapport aux analystes humains, dont les prévisions variaient généralement entre 53 % et 57 % de précision.
Les chercheurs estiment que les LLM pourraient jouer un rôle crucial dans la prise de décision financière en raison de leur vaste connaissance et de leur capacité à reconnaître des schémas, leur permettant de raisonner de manière intuitive même avec des données incomplètes.
Malgré ces résultats prometteurs, les experts soulignent que les LLM rencontrent des défis dans le domaine numérique, ayant souvent du mal avec des calculs complexes et des interprétations des données similaires à celles des humains. Le co-auteur Alex Kim a déclaré : « Bien que les LLM excellent dans les tâches textuelles, leur compréhension des nombres est fortement dépendante du contexte, manquant du raisonnement numérique approfondi que l’on trouve chez les humains. »
Les critiques sont également prudents quant à l'utilisation du modèle de réseau de neurones artificiels (ANN) comme référence dans cette étude, arguant qu'il ne représente pas les méthodes les plus avancées en finance quantitative.
Néanmoins, la capacité d'un modèle de langage général à égaler la performance de modèles d'apprentissage automatique spécialisés—et à dépasser celle des experts humains—met en lumière le potentiel transformateur des LLM dans le secteur financier. Les chercheurs ont développé une application web interactive permettant aux utilisateurs d'explorer les capacités d'analyse de GPT-4, bien qu'ils conseillent que l'exactitude de ses prévisions doit être vérifiée de manière indépendante.
À mesure que l'intelligence artificielle évolue, le rôle des analystes financiers est en passe de connaître un changement significatif. Alors que le jugement humain restera essentiel, des outils comme GPT-4 sont prêts à améliorer considérablement l'efficacité de l'analyse des états financiers, redéfinissant potentiellement l'industrie dans les années à venir.