3D-Tri : um algoritmo de indução de árvore de regressão para propriedades tridimensionais - um estudo sobre dados de docagem molecular considerando a flexibilidade do receptor

AUTOR(ES)
FONTE

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia

DATA DE PUBLICAÇÃO

17/01/2012

RESUMO

Com o avanço nos experimentos biológicos, a manipulação e análise do grande volume de dadossendo gerados por esses experimentos têm sido um dos desafios em bioinformática, onde umaimportante área de pesquisa é o desenho racional de fármacos (RDD - Rational Drug Desing). Ainteração entre macromoléculas biológicas, chamadas de receptores, e pequenas moléculas, chamadasligantes, é o princípio fundamental do RDD. É em experimentos in silico de docagem molecularque se investiga o melhor encaixe e conformação de um ligante em uma cavidade do receptor. Oresultado de um experimento de docagem pode ser avaliado a partir de um valor contínuo de energialivre de ligação (FEB - Free Energy of Binding). Tem-se empregado esforços em minerar dados deresultados de docagem molecular, com o objetivo de selecionar conformações relevantes para reduziro tempo de futuros experimentos de docagem. Nesse sentido, foi desenvolvido um repositório paraarmazenar todos os dados a respeito desses experimentos, em nível de detalhe. Com esse repositório,os dados foram devidamente pré-processados e submetidos a diferentes tarefas de mineraçãode dados. Dentre as técnicas aplicadas, a que apresentou-se mais promissora para o tipo de dadossendo utilizado foi árvore de decisão para regressão. Apesar dos resultados alcançados por essesexperimentos serem promissores, existem algumas propriedades nos experimentos que dificultam aefetiva seleção de conformações. Dessa forma, propõe-se uma estratégia que considera as propriedadestridimensionais (3D) do receptor para predizer o valor de FEB. Assim, nesta Tese é apresentadoo 3D-Tri, um algoritmo de indução de árvore de regressão que considera essas propriedades 3D,onde essas propriedades são definidas como atributos no formato x,y,z. O algoritmo proposto fazuso dessas coordenadas para dividir um nodo em duas partes, onde o átomo sendo testado parao nodo é avaliado em termos de sua posição em um bloco [(xi,xf );(yi,yf );(zi,zf )] que melhorrepresente sua posição no espaço, onde i indica a posição inicial de uma coordenada, e f indicaa posição final. O modelo induzido pode ser útil para um especialista de domínio para selecionarconformações promissoras do receptor, tendo como base as regiões dos átomos que aparecem nomodelo e que indicam melhores valores de FEB

ASSUNTO(S)

informÁtica biologia computacional mineraÇÃo de dados (informÁtica) dinÂmica molecular ciencia da computacao

Documentos Relacionados