Análise de séries temporais e utilização de algoritmos de machine learning para a predição de casos de dengue em Santa Maria (RS)
Resumo
A incidência global de dengue aumentou drasticamente nas últimas décadas, de acordo com a Organização Mundial da Saúde. Apenas nas Américas, mais de 500 milhões de pessoas correm o risco de contrair a doença. Com variações locais de risco influenciadas pela precipitação, temperatura, rápida urbanização não planejada e outros condicionantes, países como o Brasil possuem maior suscetibilidade ao vírus. Nesse sentido, considerando a influência de determinantes ambientais e de variáveis meteorológicas nas endemias, identificou-se a importância da utilização de algoritmos de aprendizado de máquina a fim de descrever o comportamento e a dinâmica da transmissão de dengue em Santa Maria (RS) para gerar previsões acerca do número de casos no município. O trabalho tem como base a utilização de séries temporais e a metodologia consiste na implementação de um modelo auto-regressivo integrado de médias móveis (ARIMA) e do algoritmo de aprendizado por agrupamento CatBoost para estimar o número de casos que ocorrerão em um intervalo de 1 a 3 meses, sendo apresentados comparativos entre as previsões dos dois algoritmos. Os modelos recebem como entrada séries de dados históricos de dengue e o registro de variáveis meteorológicas ao longo do tempo para produzir as predições. Para um período de 12 semanas a frente, testes mostram melhor desempenho do CatBoost.
Coleções
Os arquivos de licença a seguir estão associados a este item: