dc.contributor.advisor | Silva, Vanessa Siqueira Peres da | |
dc.creator | Soares, Andressa Lopez | |
dc.date.accessioned | 2024-07-04T11:01:24Z | |
dc.date.available | 2024-07-04T11:01:24Z | |
dc.date.issued | 2024-03-19 | |
dc.date.submitted | 2024 | |
dc.identifier.uri | http://repositorio.ufsm.br/handle/1/32151 | |
dc.description | Monografia (especialização) - Universidade Federal de Santa Maria, Centro de Ciências Naturais e Exatas, Curso de Especialização em Estatística e Modelagem Quantitativa, RS, 2024. | por |
dc.description.abstract | The Human Development Index (HDI) is a comprehensive indicator aimed at measuring social
well-being in various countries and territories. It was conceived as an alternative to measures
that rely solely on monetary aspects. Designed to be a simple measure, the HDI utilizes only
three basic dimensions to assess the quality of life of the population: health, education, and standard
of living. In this context, this study aims to advance the understanding of which factors,
despite not being part of the index, are associated with the HDI and can contribute to its improvement.
Specifically, the aim is to understand the factors influencing the Human Development
Index (HDI), using data modeling collected from official sources in 191 countries. As explanatory
variables, factors such as CO2 emissions, female participation in the workforce, Gini
index, prevalence of mental disorders, indicators of religious, moral, and sexual freedom, and
renewable energy consumption, among others, were considered. To investigate the relationship
between the HDI and explanatory variables, random forest models, a Machine Learning technique,
were employed, using both regression models to predict the HDI value and classification
models to categorize it. The obtained models demonstrated considerable predictive capacity.
The regression model presented a coefficient of determination (R2) of 0,932 and a root mean
square error (RMSE) value of 0,042. Meanwhile, the classification model achieved an accuracy of 73%. | eng |
dc.language | por | por |
dc.publisher | Universidade Federal de Santa Maria | por |
dc.rights | Acesso Aberto | por |
dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | * |
dc.subject | Índice de desenvolvimento humano | por |
dc.subject | Aprendizado supervisionado | por |
dc.subject | Aprendizado de máquina | por |
dc.subject | Floresta aleatória | por |
dc.subject | Regressão | por |
dc.subject | Classificação | por |
dc.subject | Human development index | eng |
dc.subject | Supervised learning | eng |
dc.subject | Machine learning | eng |
dc.subject | Random forest | eng |
dc.subject | Regression | eng |
dc.subject | Classification | eng |
dc.title | Uma análise abrangente do índice de desenvolvimento humano utilizando técnicas de machine learning | por |
dc.title.alternative | Comprehensive analysis of the human development index using machine learning techniques | eng |
dc.type | Trabalho de Conclusão de Curso de Especialização | por |
dc.degree.local | Santa Maria, RS, Brasil | por |
dc.degree.specialization | Estatística e Modelagem Quantitativa | por |
dc.description.resumo | O Índice de Desenvolvimento Humano (IDH) é um indicador abrangente que visa mensurar
o bem-estar social em vários países e territórios. Ele foi concebido como uma alternativa a
medidas que se baseiam em aspectos exclusivamente monetários. Como foi projetado para ser
uma medida simples, o IDH utiliza apenas três dimensões básicas para avaliar a qualidade de
vida da população: saúde, educação e padrão de vida. Nesse contexto, este trabalho busca avançar
na compreensão de quais fatores, que não compõem o índice, estão associados ao IDH e
podem contribuir para sua melhoria. Especificamente, objetiva-se compreender os fatores que
influenciam o Índice de Desenvolvimento Humano (IDH), utilizando modelagem de dados coletados
de fontes oficiais de 191 países. Como variáveis explicativas, foram considerados fatores
como emissão de CO2, participação feminina na força de trabalho, índice de Gini, prevalência
de transtornos mentais, indicadores de liberdade religiosa, moral e sexual, consumo de energia
renovável, entre outros. Para investigar a relação entre o IDH e as variáveis explicativas,
foram empregados modelos de floresta aleatória, uma técnica de Aprendizado de Máquina, utilizando
tanto modelos de regressão para prever o valor do IDH quanto de classificação para
categorizá-lo. Os modelos obtidos demonstraram considerável capacidade preditiva. O modelo
de regressão apresentou um coeficiente de determinação (R2) de 0.932 e um valor do erro quadrático
médio (RMSE) igual a 0.042. Já o modelo de classificação atingiu uma acurácia de 73%. | por |
dc.publisher.country | Brasil | por |
dc.publisher.initials | UFSM | por |
dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA | por |
dc.publisher.unidade | Centro de Ciências Naturais e Exatas | por |