Pressuposto da normalidade multivariada para o teste de razão de verossimilhança entre dois grupos de caracteres de mamoneira
Abstract
O teste de razão de verossimilhança para a independência entre dois grupos de variáveis
permite identificar se há ou não relação de dependência entre dois grupos de variáveis, ou
seja, se as covariâncias entre os dois grupos são nulas. Esse teste pressupõe normalidade
multivariada dos dados, o que limita sua aplicação, em muitos estudos da área agronômica,
em que se necessita utilizar, por exemplo, a análise de correlação canônica. O objetivo deste
trabalho é avaliar o erro tipo I e o poder do teste de razão de verossimilhança (TRV) para
independência entre dois grupos de variáveis em diversos cenários, constituídos pelas
combinações de: 16 tamanhos de amostra; 40 combinações de número de variáveis dos dois
grupos; e, nove graus de correlação entre as variáveis (para o poder); sob distribuição normal
multivariada e distribuição normal multivariada contaminada, bem como, comparar, nos
diferentes cenários, duas fórmulas para cálculo da estatística do teste. Dessa forma, foram
avaliados o efeito de 640 e 5760 cenários sobre as taxas de erro tipo I e poder,
respectivamente, em cada uma das distribuições de probabilidade e fórmulas. A avaliação do
desempenho do TRV foi realizada por meio de simulação computacional pelo método Monte
Carlo, utilizando-se 2000 simulações em cada um dos cenários gerados. Em situação de
normalidade multivariada: quando o número de variáveis é grande (p= 24), o TRV para a
independência entre dois grupos de variáveis, controla as taxas de erro tipo I e apresentou
poder elevado, em tamanhos de amostra superiores a 100 e 500, com uso das fórmulas para
pequenas e grandes amostras, respectivamente; e, para tamanhos amostrais pequenos (n= 25,
30 e 50), o teste apresenta bom desempenho, desde que, o número de variáveis não exceda a
12; e, a fórmula escolhida, seja para pequenas amostras. Sob distribuição normal multivariada
contaminada, o TRV para a independência entre dois grupos de variáveis possui elevados
valores de poder, mas não é robusto, pois apresenta elevadas taxas de erro tipo I, em qualquer
cenário avaliado.