A influência da variabilidade dos dados na qualidade de imputação de dados faltantes
Abstract
Métodos de Imputação foram desenvolvidos com o objetivo de definir estimativas para
dados ausentes em um banco de dados e, desta forma, solucionar possíveis
problemas gerados pela perda de tais informações. Neste estudo o objetivo é avaliar
se a variabilidade dos dados influencia nos resultados obtidos após aplicar um método
de imputação. A partir de bancos de dados reais completos, de experimentos
conduzidos no Delineamento em Blocos Casualizados, alguns com maior e outros
com menor variabilidade, foram gerados bancos de dados incompletos com a retirada
de diferentes quantidades de dados. Posteriormente, foi aplicado o método de
Imputação Múltipla Livre de Distribuição, gerando bancos de dados completos a partir
da imputação. Para os dados deste estudo, verificou-se que a variabilidade dos
mesmos influenciou de maneira negativa quando alta e nos casos em que a
variabilidade era baixa os valores imputados são mais próximos dos reais.
Confirmando assim, a importância de avaliar a variabilidade dos dados antes de optar
por aplicar o método de imputação.
Collections
The following license files are associated with this item: