Dmbuilding: Uma metodologia para montagem de visÃes em bases de dados dirigidas a problemas de mineraÃÃo de dados / Dmbuilding: a new methodology for data mart generation in the solution of data mining problems

AUTOR(ES)
DATA DE PUBLICAÇÃO

2008

RESUMO

Os avanÃos tecnolÃgicos tÃm aumentado drasticamente a magnitude dos dados armazenados em diversos domÃnios de aplicaÃÃo. Esta abundÃncia de dados tem excedido a capacidade de anÃlise humana. Como conseqÃÃncia, algumas informaÃÃes valiosas escondidas nestes grandes volumes de dados nÃo sÃo descobertas. Este cenÃrio impulsionou a criaÃÃo de vÃrias tÃcnicas capazes de extrair conhecimento de grandes volumes de dados. Algumas dessas tÃcnicas sÃo resultantes do emergente campo de Descoberta de Conhecimento em Bases de Dados (Knowledge Discovery in Databases - KDD). O processo de KDD à composto de vÃrias etapas. A etapa de preparaÃÃo dos dados consome de 50% a 90% do tempo e esforÃo necessÃrio para a realizaÃÃo de todo o processo. Quanto mais completa e consistente for a preparaÃÃo, melhor serà o resultado da mineraÃÃo de dados. Uma forma de garantir a completude e a consistÃncia dos dados à utilizar uma metodologia que aborde detalhadamente todas as atividades relacionadas à preparaÃÃo dos dados. Muitas metodologias foram propostas para o desenvolvimento de projetos de KDD. Apesar da maioria citar o processo de preparaÃÃo dos dados, poucas metodologias especÃficas para montagem de visÃo de dados tÃm sido propostas. Diante deste cenÃrio, esta dissertaÃÃo tem como objetivos investigar as metodologias para o desenvolvimento de projetos de KDD, enfatizando os aspectos relacionados à preparaÃÃo dos dados, e como resultado da investigaÃÃo, propor uma metodologia para montagem de visÃes em bases de dados dirigidas a problemas de MineraÃÃo de Dados. Esta metodologia engloba, de forma detalhada, todo processo de preparaÃÃo dos dados, desde o entendimento do problema atà a geraÃÃo da base. A viabilidade prÃtica da metodologia proposta, DMBuilding, à demonstrada atravÃs da realizaÃÃo de um estudo de caso que utiliza uma base de dados de um problema real de larga escala no domÃnio da anÃlise de risco crÃdito. Os resultados ilustram os benefÃcios da metodologia, comprovando sua relevÃncia para a montagem de visÃo em bases de dados

ASSUNTO(S)

ciencia da computacao credit analysis methodology for the development of projects of knowledge discovery in databases methodology for data marts generation in the solution of data mining problems descoberta de conhecimento em bases de dados preparaÃÃo dos dados metodologia para o desenvolvimento de projetos de descoberta de conhecimento em bases de dados knowledge discovery in databases data preparation metodologia para montagem de visÃo, anÃlise de crÃdito

Documentos Relacionados