Pesquisadores da Universidade de Chicago revelaram que modelos de linguagem de grande porte (LLMs), como o GPT-4 da OpenAI, conseguem analisar demonstrações financeiras com uma precisão que rivaliza ou até supera a de analistas financeiros profissionais. Seus achados, detalhados no documento de trabalho "Análise de Demonstrações Financeiras com Modelos de Linguagem de Grande Porte", sugerem implicações significativas para o futuro da análise financeira e da tomada de decisões.
No estudo, os pesquisadores avaliaram a capacidade do GPT-4 de prever o crescimento dos lucros corporativos, analisando balanços patrimoniais e demonstrações de resultados padronizados e anonimizados — sem qualquer contexto textual. Admiravelmente, o GPT-4 superou os analistas humanos nessa tarefa.
Os autores destacaram: "Encontramos que a precisão das previsões do LLM é comparável à de um modelo de aprendizado de máquina de ponta e especializado." Eles enfatizaram que o sucesso do LLM não se deve apenas aos dados de treinamento, mas à sua capacidade de gerar narrativas perspicazes sobre o desempenho futuro de uma empresa.
O GPT-4 obteve uma notável taxa de precisão de 60,4%, juntamente com uma pontuação F1 de 60,9%, utilizando uma abordagem inovadora de dados financeiros estruturados combinada com prompts de “cadeia de pensamento”. Esses prompts ajudam a IA a emular o processo de raciocínio de analistas humanos, permitindo identificar tendências, calcular razões e sintetizar informações para previsões. Essa abordagem resultou em uma melhoria significativa em relação aos analistas humanos, cujas previsões geralmente variam entre 53% e 57% de precisão.
Os pesquisadores acreditam que os LLMs podem desempenhar um papel crucial na tomada de decisões financeiras devido ao seu amplo conhecimento e à capacidade de reconhecer padrões, permitindo um raciocínio intuitivo mesmo com dados incompletos.
Apesar desses resultados promissores, especialistas ressaltam que os LLMs enfrentam desafios na área numérica, frequentemente lutando com cálculos complexos e interpretações de dados similares às humanas. O co-autor Alex Kim apontou: "Embora os LLMs se destaquem em tarefas textuais, sua compreensão de números depende fortemente de contexto, carecendo do raciocínio numérico profundo encontrado nos humanos."
Críticos também estão cautelosos em utilizar o modelo de rede neural artificial (ANN) como referência neste estudo, argumentando que não representa os métodos mais avançados em finanças quantitativas.
Ainda assim, a capacidade de um modelo de linguagem de uso geral de igualar o desempenho de modelos de aprendizado de máquina especializados — e até superar especialistas humanos — destaca o potencial transformador dos LLMs no setor financeiro. Os pesquisadores desenvolveram uma aplicação web interativa que permite aos usuários explorar as capacidades de análise do GPT-4, embora aconselhem que a precisão de suas previsões deve ser verificada de forma independente.
À medida que a inteligência artificial evolui, o papel dos analistas financeiros está prestes a mudar significativamente. Embora o julgamento humano continue sendo vital, ferramentas como o GPT-4 estão prontas para aumentar drasticamente a eficiência da análise de demonstrações financeiras, potencialmente remodelando a indústria nos próximos anos.