Uso da base de dados decundária KOG como ferramenta para caracterização de expressão gênica e mineração de dados em projetos transcriptoma
AUTOR(ES)
Mauricio de Alvarenga Mudado
DATA DE PUBLICAÇÃO
2007
RESUMO
A set of new results, techniques and tools are presented in this work for data mining and to help in the analysis of Expressed Sequence Tags (EST) generated by transcriptome projects. The secondary database KOG was utilized as a tool in the alignment and automatic annotation of ESTs from four organisms, A. thaliana, C. elegans, D. melanogaster e H. sapiens. These alignments were utilized to many purposes and in many experiments, like: inference of similarity cutoffs utilizing tBLASTn with ESTs and proteins from the same organism; development of an annotation test with EST and KOG proteins; evaluation of the quality of annotation by using the cutoff values discovered; evaluation of the quality of annotation by using uniques generated by the TGICL software; functional characterization of ESTs with KOG; evaluation of KOG coverage with incremental EST number and inference of a minimal number of EST to cover it; creation of a web tool named K-EST that makes available the EST sampling data with KOG and also the conservation data among KOG clusters; inference of gene loss, or at least loss of gene expression in organisms belonging or not to the KOG database, by using EST sampling data and conservation.
ASSUNTO(S)
expressão gênica teses. mineração de dados (computação) teses. bioinformática teses. sequência de nucleotídios teses.
ACESSO AO ARTIGO
http://hdl.handle.net/1843/GRFO-7DYQ2ZDocumentos Relacionados
- Uso de imagens orbitais como base de dados para projetos de reforma agrária
- Mineração de textos aplicada à análise de dados de expressão gênica por microarranjos.
- Redução da dimensionalidade em bases de dados de expressão gênica
- Imagens orbitais como base de dados em projetos de reforma agrária.
- Aplicação da análise de agrupamento de dados de expressão gênica temporal a dados em painel