Uso de Data Mining na descoberta ou identificação de regras de enovelamento baseado em perfis de hidrofobicidade / Use of Data Mining in the discovery or identification of folding rules based on hydrophobicity profiles

AUTOR(ES)
FONTE

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia

DATA DE PUBLICAÇÃO

24/03/2011

RESUMO

As proteínas são moléculas complexas encontradas em células vivas. Elas possuem uma estrutura terciária (tridimensional) específica que determina sua função e é necessária para a ligação específica de substratos ou outros ligantes. A estrutura de uma proteína pode ser organizada em quatro níveis hierárquicos: estrutura primária (sequência de aminoácidos), estrutura secundária (arranjo espacial local da sequência de aminoácidos), estrutura terciária (organização espacial da estrutura secundária no espaço 3D) e estrutura quaternária (arranjo espacial da estrutura terciária). Os progressos nas áreas de biologia, bioinformática e biotecnologia tem gerado uma enorme quantidade de sequências de dados que requerem análise profunda. Ao mesmo tempo, os avanços da pesquisa em mineração de dados levou ao desenvolvimento de diversas técnicas eficientes e escaláveis para descoberta de padrões interessantes em grandes bancos de dados. Neste trabalho foram aplicadas técnicas de mineração de dados para identificar e/ou descobrir perfis/padrões de hidrofobicidade que levem em uma estrutura secundária específica (-hélice, folha-). Esses padrões poderão auxiliar técnicas de predição 1D e 3D e podem ser candidatos a motifs sequênciais. Com esse objetivo, foi desenvolvida uma base de dados local (BDL) constituída por aproximandamente 21:000 proteínas globulares extraídas do Protein Data Bank (PDB) e por 994 proteínas transmembrana extraídas do Membrane Protein Data Bank (MPDB) e implementado um algoritmo para extrair regras de associação entre os registros que compõem nossa BDL. Dentre as regras obtidas não foi observado nenhum perfil/padrão hidrofóbico que proíba a formação de uma estrutura secundária específica. Observou-se também, que as sequências menores (janelas de tamanho 7 e 11) apresentam maior número de regras, ou seja, é mais fácil encontrarmos correlação entre perfil hidrofóbico e estrutura secundária nesses tamanhos de janela e que a maioria dos padrões encontrados para estas janelas levam a uma estrutura do tipo -hélice. Nossos resultados, sugerem que estruturas do tipo -hélice são menos suscetivéis a mutação dos resíduos que as compõem. Observou-se que desde que a nova sequência (sequência mutada) preserve as características hidrofóbicas da sequência original, a estrutura secundária (-hélice) será mantida.

ASSUNTO(S)

outros proteínas hidrofobicidade bioinformática mineração de dados folding biologia estrutural protein hidrophobicity bioinformatic data mining folding structural biology

Documentos Relacionados