Uma análise abrangente do índice de desenvolvimento humano utilizando técnicas de machine learning
Resumo
O Índice de Desenvolvimento Humano (IDH) é um indicador abrangente que visa mensurar
o bem-estar social em vários países e territórios. Ele foi concebido como uma alternativa a
medidas que se baseiam em aspectos exclusivamente monetários. Como foi projetado para ser
uma medida simples, o IDH utiliza apenas três dimensões básicas para avaliar a qualidade de
vida da população: saúde, educação e padrão de vida. Nesse contexto, este trabalho busca avançar
na compreensão de quais fatores, que não compõem o índice, estão associados ao IDH e
podem contribuir para sua melhoria. Especificamente, objetiva-se compreender os fatores que
influenciam o Índice de Desenvolvimento Humano (IDH), utilizando modelagem de dados coletados
de fontes oficiais de 191 países. Como variáveis explicativas, foram considerados fatores
como emissão de CO2, participação feminina na força de trabalho, índice de Gini, prevalência
de transtornos mentais, indicadores de liberdade religiosa, moral e sexual, consumo de energia
renovável, entre outros. Para investigar a relação entre o IDH e as variáveis explicativas,
foram empregados modelos de floresta aleatória, uma técnica de Aprendizado de Máquina, utilizando
tanto modelos de regressão para prever o valor do IDH quanto de classificação para
categorizá-lo. Os modelos obtidos demonstraram considerável capacidade preditiva. O modelo
de regressão apresentou um coeficiente de determinação (R2) de 0.932 e um valor do erro quadrático
médio (RMSE) igual a 0.042. Já o modelo de classificação atingiu uma acurácia de 73%.
Coleções
Os arquivos de licença a seguir estão associados a este item: