Modelos escondidos de Markov para classificaÃÃo de proteÃnas

AUTOR(ES)
DATA DE PUBLICAÇÃO

2002

RESUMO

A Biologia Molecular apresenta-se como uma Ãrea da Biologia bastante fÃrtil em aplicaÃÃes de tÃcnicas computacionais. A estrutura das molÃculas de Ãcidos nuclÃicos e proteÃnas, composta de partÃculas alinhadas ao longo de uma cadeia, permite-lhes serem tratadas computacionalmente como seqÃÃncias de sÃmbolos de um alfabeto finito. O estudo das similaridades existentes entre seqÃÃncias distintas de proteÃnas que desempenham a mesma funÃÃo pode ajudar a traÃar caminhos evolucionÃrios comuns e descobrir semelhanÃas entre diferentes organismos, que podem levar à compreensÃo de famÃlias inteiras, contribuindo para a definiÃÃo de mecanismos gerais que regem as formas de vida na Terra. Modelos Escondidos de Markov â HMMs, tÃm-se apresentado como uma excelente tÃcnica para a comparaÃÃo de seqÃÃncias de proteÃnas, suportada por uma forte fundamentaÃÃo matemÃtica. Este processo de modelagem à baseado nas caracterÃsticas estatÃsticas do objeto de estudo, o qual à visto como um processo aleatÃrio parametrizado, cujos parÃmetros podem ser determinados de uma maneira bem definida e precisa. No projeto de um HMM, hà trÃs problemas fundamentais a serem resolvidos: (1) AvaliaÃÃo da probabilidade de uma seqÃÃncia de observaÃÃes, dado o HMM; (2) DeterminaÃÃo da melhor seqÃÃncia de estados (a mais provÃvel); (3) Ajuste dos parÃmetros do modelo, de acordo com a seqÃÃncia observada. Neste trabalho à apresentada uma arquitetura de HMM para modelagem de famÃlias de proteÃnas, que à implementada com uma tÃcnica de aprendizagem de mÃquina a qual permite que os parÃmetros do modelo, tais como penalidades por remoÃÃes, inserÃÃes e substituiÃÃes, sejam aprendidos durante a construÃÃo do modelo, sem a introduÃÃo de conhecimento prÃvio. Para aplicar a tÃcnica, foi desenvolvida uma ferramenta para construÃÃo de um HMM capaz de classificar seqÃÃncias de proteÃnas. Foram realizados experimentos com trÃs famÃlias de proteÃnas, a saber, globinas, proteinoquinases e GTPases. Para cada famÃlia, um HMM foi treinado usando um conjunto de seqÃÃncias daquela famÃlia. Os resultados dos experimentos mostram que a tÃcnica HMM à capaz de explorar informaÃÃes estatÃsticas contidas em uma grande quantidade de seqÃÃncias de proteÃnas de uma mesma famÃlia. Os HMMâs construÃdos sÃo capazes de distinguir com um alto grau de precisÃo seqÃÃncias membros de seqÃÃncias nÃo membros das famÃlias modeladas

ASSUNTO(S)

ciencia da computacao sequÃncias de observaÃÃes classificaÃÃo de proteÃnas modelos de markov

Documentos Relacionados