Dimensionamento amostral em análises de componentes principais, variáveis canônicas e agrupamento em cultivares de soja

Souza, Rafael Rodrigues de

Visualizar/Abrir

Tese (40.33Mb)

Data

2024-05-17

Autor

Souza, Rafael Rodrigues de

Primeiro orientador

Cargnelutti Filho, Alberto

Primeiro membro da banca

Haesbaert, Fernando Machado

Segundo membro da banca

Carvalho, Ivan Ricardo

Terceiro membro da banca

Toebe, Marcos

Quarto membro da banca

Maziero, Sandra Maria

Metadata

Mostrar registro completo

Resumo

Intensivamente, pesquisas fundamentam-se no uso de metodologias indiretas para determinar a divergência genética por meio de caracteres fenotípicos em soja. Entre as principais metodologias, destacam-se o uso de componentes principais, variáveis canônicas e análises hierárquicas. Embora essas ferramentas apresentem ampla aplicabilidade, é importante ressaltar que seu uso nem sempre é acompanhado de um embasamento amostral representativo. Ou seja, normalmente há uma ausência de prévia definição amostral, de modo que decisões empíricas são na maioria das vezes tomadas. Neste sentido, o presente estudo tem como objetivos analisarem a resposta de técnicas de divergência genética frente às variações no número de plantas amostradas; definir um tamanho de amostra referência para técnicas componentes principais, variáveis canônicas e técnicas de agrupamento em soja; e, propor novas abordagens robustas de definição do tamanho amostral. Logo, foram conduzidos ensaios de campo durante a safra agrícola de 2017/2018, em dois locais no Rio Grande do Sul e três épocas de semeadura, totalizando seis experimentos. As unidades experimentais foram compostas por cinco fileiras, com três metros de comprimento, espaçadas em 0,45 metros. O delineamento de blocos completos ao acaso foi utilizado para avaliar 20 cultivares de soja, com três repetições em cada experimento. Durante a maturação, foram avaliadas dez características morfológicas em 20 plantas por unidade experimental, totalizando 7.200 plantas mensuradas individualmente. A seguir, realizaram-se simulações com reposição (reamostragem bootstrap) em cenários amostrais variando de 1 a 100 plantas por unidade experimental para avaliar os autovalores dos componentes principais, os componentes canônicos das variáveis canônicas e o coeficiente de correlação cofenético oriundo da combinação de nove medidas de dissimilaridade e sete métodos de agrupamento. Essas simulações bootstrap foram conduzidas individualmente para os seis experimentos, seguida por uma análise conjunta dos experimentos. No que diz respeito ao dimensionamento amostral para a técnica de componentes principais, utilizou-se o método do erro em porcentagem da média. Para o segundo estudo, relacionado às variáveis canônicas, empregou-se uma abordagem que combinou modelos não lineares e ponto de máxima curvatura para estimar o tamanho da amostra. No terceiro estudo, desenvolveu-se uma metodologia para definição amostral baseada em aprendizado de máquina não supervisionado, juntamente com otimização bayesiana, somado a uma modificação do método de máxima curvatura por meio de distâncias perpendiculares. Foi observada uma melhoria gradual na estimativa dos autovalores das variáveis canônicas e do coeficiente de correlação cofenético com o aumento do número de plantas amostradas. Constatou-se que 18 plantas por unidade experimental foram suficientes para estimar os dois primeiros componentes principais, enquanto 36 plantas foram necessárias para as variáveis canônicas. Nas análises hierárquicas, verificou-se uma variação no tamanho amostral representativo, sendo este dependente da medida de dissimilaridade e do método de agrupamento utilizado. No entanto, sugere-se que 27 plantas por unidade experimental foram suficientes para uma amostragem representativa em análises hierárquicas. Deste modo, se possibilita otimizar o uso das metodologias de componentes principais, variáveis canônicas e análises hierárquicas, assegurando a confiabilidade dos seus resultados e inibindo tomadas de decisões empíricas sobre o tamanho amostral em soja.

URI

http://repositorio.ufsm.br/handle/1/32041

Coleções

Programa de Pós-Graduação em Agronomia [242]

Os arquivos de licença a seguir estão associados a este item:

Creative Commons

Exceto quando indicado o contrário, a licença deste item é descrito como Attribution-NonCommercial-NoDerivatives 4.0 International