Combinations of distance measures and clustering algorithms in pepper germplasm characterization

AUTOR(ES)
FONTE

Hortic. Bras.

DATA DE PUBLICAÇÃO

18/07/2019

RESUMO

RESUMO Com o aumento da perda da variabilidade genética e a procura por genótipos mais adaptados e produtivos, a caracterização e a avaliação dos genótipos conservados em um banco de germoplasma são de elevada importância. Essas podem ser obtidas de várias formas, gerando dados quantitativos e qualitativos. A análise conjunta dessas variáveis pode ser considerada uma estratégia para a avaliação precisa do germoplasma. O presente trabalho teve como objetivo avaliar diferentes técnicas de agrupamento para caracterização e avaliação de acessos de Capsicum spp. utilizando combinações de medidas específicas para as variáveis quantitativas e qualitativas. Foram caracterizados 56 acessos de Capsicum spp. com base em 25 descritores morfoagronômicos. As distâncias analisadas foram seis quantitativas [A1) média das diferenças absolutas dos rank-padronizados (Gower), A2) correlação de Pearson, A3) Kulczynski, A4) Canberra, A5) Bray-Curtis, e A6) Morisita] combinadas com a distância para dados qualitativos [Coincidência Simples (B1)]. Os agrupamentos foram realizados pelos métodos hierárquicos aglomerativos (Ward, Vizinho Mais Próximo, Vizinho Mais Distante, UPGMA e WPGMA). Todas as distâncias combinadas foram altamente correlacionadas. O agrupamento UPGMA obteve maior eficiência pelas análises de correlação cofenética e 2-norm, indicando uma concordância entre os dois métodos. Seis grupos foram considerados como número ideal pelo agrupamento UPGMA, no qual a distância de Gower apresentou um melhor ajuste para formação dos grupos. A maioria das distâncias combinadas utilizando o agrupamento UPGMA permitiu a separação dos acessos em relação às espécies, utilizando simultaneamente dados quantitativos e qualitativos podendo ser uma alternativa para análise simultânea de dados conjuntos, visando uma comparação entre diferentes agrupamentos.ABSTRACT Characterization and evaluation of genotypes conserved in the germplasm banks have become of great importance due to gradual loss of genetic variability and search for more adapted and productive genotypes. This can be obtained through several ways, generating quantitative and qualitative data. Joint analysis of those variables may be considered a strategy for an accurate germplasm characterization. In this study we aimed to evaluate different clustering techniques for characterization and evaluation of Capsicum spp. accessions using combinations of specific measures for quantitative and qualitative variables. A collection of 56 Capsicum spp. accessions was characterized based on 25 morphoagronomic descriptors. Six quantitative distances were used [A1) average of the range-standardized absolute difference (Gower), A2) Pearson correlation, A3) Kulczynski, A4) Canberra, A5) Bray-Curtis, and A6) Morisita] combined with distance for qualitative data [Simple Coincidence (B1)]. Clustering analyses were performed using agglomerative hierarchical methods (Ward, the nearest neighbor, the farthest neighbor, UPGMA and WPGMA). All combined distances were highly correlated. UPGMA clustering was the most efficient through cophenetic correlation and 2-norm analyses, showing a concordance between the two methods. Six clusters were considered an ideal number by UPGMA clustering, in which Gower distance showed a better adjustment for clustering. Most combined distances using UPGMA clustering allowed the separation of the accessions in relation to species, using both quantitative and qualitative data, which could be an alternative for simultaneous joint analysis, aiming to compare different clusters.

Documentos Relacionados