Utilizando agrupamento com restrições e agrupamento espectral para integração de dados de enzimas

AUTOR(ES)
FONTE

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia

DATA DE PUBLICAÇÃO

28/02/2011

RESUMO

Quando múltiplas fontes de dados estão disponíveis para serem mineradas, geralmente é necessário um processo a priori de integração de dados. Tal processo pode ser custoso e não levar a bons resultados, visto que informação importante possivelmente será descartada. Nesta dissertação se propõe o uso de agrupamento com restrições e agrupamento espectral como estratégias para integrar fontes de dados sem perda de qualquer informação. O processo consiste basicamente em adicionar as fontes complementares na forma de restrições que os algoritmos de agrupamento devem satisfazer, ou utilizá-las para aumentar a similaridade entre pares de objetos para os algoritmos de agrupamento espectral. Como uma aplicação concreta desta abordagem, esta dissertação foca no problema de previsão de funções enzimáticas, que é uma tarefa complexa, geralmente realizada por meio de trabalho experimental intensivo. Agrupamentos com restrições e espectral são empregados como meios de integração de informação proveniente de diversas fontes, e a forma como tal informação impacta a qualidade dos resultados em um cenário de agrupamento de enzimas é analisada. Os resultados mostram que o uso de conhecimento de domínio melhora, em geral, a qualidade dos agrupamentos em comparação com os resultados obtidos utilizando apenas a base de dados principal.

ASSUNTO(S)

computação teses. mineração de dados (computação) teses

Documentos Relacionados