Utilizando agrupamento com restrições e agrupamento espectral para integração de dados de enzimas
AUTOR(ES)
Elisa Boari de Lima
FONTE
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia
DATA DE PUBLICAÇÃO
28/02/2011
RESUMO
Quando múltiplas fontes de dados estão disponíveis para serem mineradas, geralmente é necessário um processo a priori de integração de dados. Tal processo pode ser custoso e não levar a bons resultados, visto que informação importante possivelmente será descartada. Nesta dissertação se propõe o uso de agrupamento com restrições e agrupamento espectral como estratégias para integrar fontes de dados sem perda de qualquer informação. O processo consiste basicamente em adicionar as fontes complementares na forma de restrições que os algoritmos de agrupamento devem satisfazer, ou utilizá-las para aumentar a similaridade entre pares de objetos para os algoritmos de agrupamento espectral. Como uma aplicação concreta desta abordagem, esta dissertação foca no problema de previsão de funções enzimáticas, que é uma tarefa complexa, geralmente realizada por meio de trabalho experimental intensivo. Agrupamentos com restrições e espectral são empregados como meios de integração de informação proveniente de diversas fontes, e a forma como tal informação impacta a qualidade dos resultados em um cenário de agrupamento de enzimas é analisada. Os resultados mostram que o uso de conhecimento de domínio melhora, em geral, a qualidade dos agrupamentos em comparação com os resultados obtidos utilizando apenas a base de dados principal.
ASSUNTO(S)
computação teses. mineração de dados (computação) teses
ACESSO AO ARTIGO
http://hdl.handle.net/1843/SLSS-8GQGQCDocumentos Relacionados
- Mineração de texto, agrupamento de seqüências e integração de dados para o desenvolvimento da Plant Defense Mechanisms Database
- Diferenciação espectral de solos utilizando dados obtidos em laboratório e por sensor orbital
- Um algoritmo bioinspirado para agrupamento de dados
- Um algoritmo evolutivo rápido para agrupamento de dados
- Um estudo sobre métodos de Kernel para classificação e agrupamento de dados