Dimensionamento amostral em análises de componentes principais, variáveis canônicas e agrupamento em cultivares de soja
Visualizar/ Abrir
Data
2024-05-17Primeiro membro da banca
Haesbaert, Fernando Machado
Segundo membro da banca
Carvalho, Ivan Ricardo
Terceiro membro da banca
Toebe, Marcos
Quarto membro da banca
Maziero, Sandra Maria
Metadata
Mostrar registro completoResumo
Intensivamente, pesquisas fundamentam-se no uso de metodologias indiretas para determinar a divergência genética por meio de caracteres fenotípicos em soja. Entre as principais metodologias, destacam-se o uso de componentes principais, variáveis canônicas e análises hierárquicas. Embora essas ferramentas apresentem ampla aplicabilidade, é importante ressaltar que seu uso nem sempre é acompanhado de um embasamento amostral representativo. Ou seja, normalmente há uma ausência de prévia definição amostral, de modo que decisões empíricas são na maioria das vezes tomadas. Neste sentido, o presente estudo tem como objetivos analisarem a resposta de técnicas de divergência genética frente às variações no número de plantas amostradas; definir um tamanho de amostra referência para técnicas componentes principais, variáveis canônicas e técnicas de agrupamento em soja; e, propor novas abordagens robustas de definição do tamanho amostral. Logo, foram conduzidos ensaios de campo durante a safra agrícola de 2017/2018, em dois locais no Rio Grande do Sul e três épocas de semeadura, totalizando seis experimentos. As unidades experimentais foram compostas por cinco fileiras, com três metros de comprimento, espaçadas em 0,45 metros. O delineamento de blocos completos ao acaso foi utilizado para avaliar 20 cultivares de soja, com três repetições em cada experimento. Durante a maturação, foram avaliadas dez características morfológicas em 20 plantas por unidade experimental, totalizando 7.200 plantas mensuradas individualmente. A seguir, realizaram-se simulações com reposição (reamostragem bootstrap) em cenários amostrais variando de 1 a 100 plantas por unidade experimental para avaliar os autovalores dos componentes principais, os componentes canônicos das variáveis canônicas e o coeficiente de correlação cofenético oriundo da combinação de nove medidas de dissimilaridade e sete métodos de agrupamento. Essas simulações bootstrap foram conduzidas individualmente para os seis experimentos, seguida por uma análise conjunta dos experimentos. No que diz respeito ao dimensionamento amostral para a técnica de componentes principais, utilizou-se o método do erro em porcentagem da média. Para o segundo estudo, relacionado às variáveis canônicas, empregou-se uma abordagem que combinou modelos não lineares e ponto de máxima curvatura para estimar o tamanho da amostra. No terceiro estudo, desenvolveu-se uma metodologia para definição amostral baseada em aprendizado de máquina não supervisionado, juntamente com otimização bayesiana, somado a uma modificação do método de máxima curvatura por meio de distâncias perpendiculares. Foi observada uma melhoria gradual na estimativa dos autovalores das variáveis canônicas e do coeficiente de correlação cofenético com o aumento do número de plantas amostradas. Constatou-se que 18 plantas por unidade experimental foram suficientes para estimar os dois primeiros componentes principais, enquanto 36 plantas foram necessárias para as variáveis canônicas. Nas análises hierárquicas, verificou-se uma variação no tamanho amostral representativo, sendo este dependente da medida de dissimilaridade e do método de agrupamento utilizado. No entanto, sugere-se que 27 plantas por unidade experimental foram suficientes para uma amostragem representativa em análises hierárquicas. Deste modo, se possibilita otimizar o uso das metodologias de componentes principais, variáveis canônicas e análises hierárquicas, assegurando a confiabilidade dos seus resultados e inibindo tomadas de decisões empíricas sobre o tamanho amostral em soja.
Coleções
Os arquivos de licença a seguir estão associados a este item: