Uso de Meta-aprendizado para a SeleÃÃo e OrdenaÃÃo de Algoritmos de Agrupamento Aplicados a Dados de ExpressÃo GÃnica

AUTOR(ES)
DATA DE PUBLICAÇÃO

2008

RESUMO

O volume de dados de expressÃo gÃnica vem crescendo exponencialmente nos Ãltimos anos devido Ãs novas tecnologias da Biologia Molecular, que permitem medir a expressÃo de milhares de genes ao mesmo tempo. A anÃlise computacional desses dados tem grande importÃncia na Biologia e na Medicina. Ela permite, por exemplo, a descoberta de novas classes de cÃncer biologicamente e clinicamente significantes e a identificaÃÃo de novas funÃÃes dos genes. As tÃcnicas de Aprendizado de MÃquina nÃo-supervisionado fazem parte da metodologia de anÃlise usada pelos especialistas. Existem diversos algoritmos de agrupamento de dados, cada um procurando particionar os dados de uma maneira especÃfica. A escolha desse algoritmo à fundamental para a qualidade do agrupamento e, portanto, para a anÃlise adequada dos resultados. Propomos uma metodologia de meta-aprendizado para a escolha dos algoritmos de agrupamento de dados no contexto de dados de expressÃo gÃnica de cÃlulas cancerÃgenas. Atà o momento, o meta-aprendizado vinha sendo utilizado apenas no contexto supervisionado. Nesta DissertaÃÃo, estendemos esse conceito para problemas nÃo-supervisionados. Usamos bases de dados de diferentes experimentos com microarrays de vÃrios estudos sobre cÃncer. ExtraÃmos caracterÃsticas relevantes de cada base de dados a fim de empregÃ-las no aprendizado de Redes Neurais, k-Vizinhos Mais PrÃximos e MÃquinas de Vetores Suporte, utilizados como meta-aprendizes. Esses mÃtodos foram usados como sistemas de aprendizado para predizer a ordem de desempenho dos algoritmos de agrupamento, bem como selecionar o melhor algoritmo, de acordo com essas caracterÃsticas. Realizamos um conjunto de experimentos para validar o uso de cada meta-aprendiz. Nesse contexto, mostramos que, em mÃdia, os rankings sugeridos pelas Maquinas de Vetores Suporte sÃo significativamente mais correlacionados com o ranking ideal do que aqueles obtidos com o ranking default. Conseguimos realizar um estudo inovador que pode ser expandido para dados de outros contextos, servindo como ponto de partida para novas abordagens

ASSUNTO(S)

gene expression unsupervised learning expressÃo gÃnica meta-aprendizado aprendizado nÃo-supervisionado ciencia da computacao meta-learning

Documentos Relacionados