Uso de machine learning para a classificação do crédito de empresas por meio de demonstrativos financeiros
Resumo
Um elemento importante para a economia é a chamada Classificação de Crédito, um conceito
indicativo das condições de quitação de créditos concedidos. O processo de classificação é
realizado por agências de classificação que usam métodos que não são completamente compreendidos/reproduzíveis, pois dependem de um expertise proprietário. Aumentar a transparência no processo de Classificação de Crédito ajudaria a explicar a razão de certas entidades conseguirem tomar crédito e outras não. Nesse sentido, o presente trabalho visa utilizar dados públicos para predição de Classificação de Crédito de empresas por meio de modelos de aprendizado de máquina. Os modelos utilizados foram: Árvore de Decisão, Floresta Aleatória, Gradient Boosting para Classificação de Crédito binária e multiclasse. Como resultados, obteve-se uma maior a acessibilidade a respeito da Classificação de Crédito e a obtenção de modelos de livre acesso que sejam autoexplicativos. O modelo com melhor desempenho, tanto para a classificação binária quanto para a multiclasse, foi o Gradient Boosting, que apresentou o melhor F1 score. Em suma, o presente trabalho mostrou que o uso de aprendizado de máquina para a Classificação de Crédito é uma proposta viável e informativa para esse processo, além de ser reproduzível.
Coleções
Os arquivos de licença a seguir estão associados a este item: