Testes de multicolinearidade em variáveis morfológicas e produtivas de tomateiro
Resumo
Este trabalho apresenta um estudo comparativo de metodologias de identificação da multicolinearidade em análises multivariadas. A multicolinearidade é ocasionada pelo intenso relacionamento linear entre variáveis em estudo e pode prejudicar a interpretação dos resultados de várias técnicas de estatística multivariada. Os objetivos deste trabalho foram comparar metodologias de identificação da multicolinearidade em diversos cenários de número de variáveis, tamanho de amostra e grau de correlação entre variáveis, bem como, identificar técnicas mais adequadas para o identificação da multicolinearidade. Foram utilizados dados de variáveis morfológicas e produtivas de um experimento com tomateiro para gerar as amostras aleatórias com distribuição normal multivariada em cenários de números de variáveis e tamanhos de amostra em três níveis de correlação entre as variáveis (baixa, média e alta). Para cada um dos cenários foram obtidas 1000 amostras multivariadas e quantificado o percentual de indicação de presença de multicolinearidade pelos critérios do determinante da matriz de correlação, número de condição e fator de inflação de variância e pelos testes de Farrar e Glauber e de Haitovsky. Os critérios e testes de avaliação da multicolinearidade apresentam resultados diferentes conforme são alterados o número de variáveis, tamanho de amostra e grau de correlação entre as variáveis. Tamanho de amostra pouco superior ao número de variáveis aumenta a ocorrência de multicolinearidade. Os critérios do número de condição e fator de inflação de variância são eficientes na identificação de multicolinearidade entre variáveis de tomateiro.