Mineração de dados temporais da covid-19 no Brasil: busca de similaridades nas características dos estados brasileiros através do agrupamento hierárquico
Resumo
A pandemia da COVID-19 apresentou uma série de desafios sem precedentes para a saúde pública global, e o Brasil foi um dos países severamente afetados. Diversos trabalhos foram feitos para comparar diferentes contextos temporais da COVID-19. Neste trabalho foi realizado algo similar, explorando a dinâmica temporal da COVID-19 no Brasil, buscando possíveis padrões entre estados específicos, comparando-os em determinadas características. Para isso utilizou-se um conjunto de dados que compreende notificações de casos da doença em cada estado brasileiro durante os anos de 2020 e 2021, e exploraram-se métricas de distância como Dynamic Time Warping (DTW) e distância Euclidiana para analisar séries temporais de dados. Além disso, as ferramentas PySpark e Pandas foram utilizadas para manipulação e preparação de dados, facilitando a análise subsequente. Foram empregados métodos como importância de recursos, para identificar e selecionar as características nas notificações que impactavam nas evoluções clínicas, e o Agrupamento Hierárquico para relacionar as séries temporais em suas similaridades.
Coleções
Os arquivos de licença a seguir estão associados a este item: