Uma análise abrangente do índice de desenvolvimento humano utilizando técnicas de machine learning

Soares, Andressa Lopez

dc.contributor.advisor	Silva, Vanessa Siqueira Peres da
dc.creator	Soares, Andressa Lopez
dc.date.accessioned	2024-07-04T11:01:24Z
dc.date.available	2024-07-04T11:01:24Z
dc.date.issued	2024-03-19
dc.date.submitted	2024
dc.identifier.uri	http://repositorio.ufsm.br/handle/1/32151
dc.description	Monografia (especialização) - Universidade Federal de Santa Maria, Centro de Ciências Naturais e Exatas, Curso de Especialização em Estatística e Modelagem Quantitativa, RS, 2024.	por
dc.description.abstract	The Human Development Index (HDI) is a comprehensive indicator aimed at measuring social well-being in various countries and territories. It was conceived as an alternative to measures that rely solely on monetary aspects. Designed to be a simple measure, the HDI utilizes only three basic dimensions to assess the quality of life of the population: health, education, and standard of living. In this context, this study aims to advance the understanding of which factors, despite not being part of the index, are associated with the HDI and can contribute to its improvement. Specifically, the aim is to understand the factors influencing the Human Development Index (HDI), using data modeling collected from official sources in 191 countries. As explanatory variables, factors such as CO2 emissions, female participation in the workforce, Gini index, prevalence of mental disorders, indicators of religious, moral, and sexual freedom, and renewable energy consumption, among others, were considered. To investigate the relationship between the HDI and explanatory variables, random forest models, a Machine Learning technique, were employed, using both regression models to predict the HDI value and classification models to categorize it. The obtained models demonstrated considerable predictive capacity. The regression model presented a coefficient of determination (R2) of 0,932 and a root mean square error (RMSE) value of 0,042. Meanwhile, the classification model achieved an accuracy of 73%.	eng
dc.language	por	por
dc.publisher	Universidade Federal de Santa Maria	por
dc.rights	Acesso Aberto	por
dc.rights	Attribution-NonCommercial-NoDerivatives 4.0 International	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/4.0/	*
dc.subject	Índice de desenvolvimento humano	por
dc.subject	Aprendizado supervisionado	por
dc.subject	Aprendizado de máquina	por
dc.subject	Floresta aleatória	por
dc.subject	Regressão	por
dc.subject	Classificação	por
dc.subject	Human development index	eng
dc.subject	Supervised learning	eng
dc.subject	Machine learning	eng
dc.subject	Random forest	eng
dc.subject	Regression	eng
dc.subject	Classification	eng
dc.title	Uma análise abrangente do índice de desenvolvimento humano utilizando técnicas de machine learning	por
dc.title.alternative	Comprehensive analysis of the human development index using machine learning techniques	eng
dc.type	Trabalho de Conclusão de Curso de Especialização	por
dc.degree.local	Santa Maria, RS, Brasil	por
dc.degree.specialization	Estatística e Modelagem Quantitativa	por
dc.description.resumo	O Índice de Desenvolvimento Humano (IDH) é um indicador abrangente que visa mensurar o bem-estar social em vários países e territórios. Ele foi concebido como uma alternativa a medidas que se baseiam em aspectos exclusivamente monetários. Como foi projetado para ser uma medida simples, o IDH utiliza apenas três dimensões básicas para avaliar a qualidade de vida da população: saúde, educação e padrão de vida. Nesse contexto, este trabalho busca avançar na compreensão de quais fatores, que não compõem o índice, estão associados ao IDH e podem contribuir para sua melhoria. Especificamente, objetiva-se compreender os fatores que influenciam o Índice de Desenvolvimento Humano (IDH), utilizando modelagem de dados coletados de fontes oficiais de 191 países. Como variáveis explicativas, foram considerados fatores como emissão de CO2, participação feminina na força de trabalho, índice de Gini, prevalência de transtornos mentais, indicadores de liberdade religiosa, moral e sexual, consumo de energia renovável, entre outros. Para investigar a relação entre o IDH e as variáveis explicativas, foram empregados modelos de floresta aleatória, uma técnica de Aprendizado de Máquina, utilizando tanto modelos de regressão para prever o valor do IDH quanto de classificação para categorizá-lo. Os modelos obtidos demonstraram considerável capacidade preditiva. O modelo de regressão apresentou um coeficiente de determinação (R2) de 0.932 e um valor do erro quadrático médio (RMSE) igual a 0.042. Já o modelo de classificação atingiu uma acurácia de 73%.	por
dc.publisher.country	Brasil	por
dc.publisher.initials	UFSM	por
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA	por
dc.publisher.unidade	Centro de Ciências Naturais e Exatas	por

Arquivos deste item

Nome:: TCCE_EMQ_2024_SOARES_ANDRESSA.pdf
Tamanho:: 1.088Mb
Formato:: PDF
Descrição:: TCC de Especialização

Visualizar/Abrir

Nome:: license_rdf
Tamanho:: 805bytes
Formato:: application/rdf+xml

Visualizar/Abrir

Este item aparece na(s) seguinte(s) coleção(s)

Estatística e Modelagem Quantitativa [125]
Coleção de trabalhos de conclusão do Curso de Especialização em Estatística e Modelagem Quantitativa

Mostrar registro simples

Exceto quando indicado o contrário, a licença deste item é descrito como Acesso Aberto