DiscretizaÃÃo para aprendizagem bayesiana: aplicaÃÃo no auxÃlio à validaÃÃo de dados em proteÃÃo ao vÃo.

AUTOR(ES)
DATA DE PUBLICAÇÃO

2003

RESUMO

A utilizaÃÃo de redes Bayesianas, que sÃo uma representaÃÃo compacta de distribuiÃÃes de probabilidades conjuntas de um domÃnio, vem crescendo em diversas Ãreas e aplicaÃÃes. As redes Bayesianas podem ser construÃdas a partir do conhecimento de especialistas ou por algoritmos de aprendizagem Bayesiana que inferem as relaÃÃes entre as variÃveis do domÃnio a partir de um conjunto de dados de treinamento. A construÃÃo manual de redes Bayesianas, pode ser trabalhosa, cara e estar propenso a erros vem cada vez mais sendo preterida pelo uso de algoritmos de aprendizagem Bayesiana, mas os algoritmos de aprendizagem em geral pressupÃem que as variÃveis utilizadas na aprendizagem sejam discretas ou, caso sejam contÃnuas, apresentem uma distribuiÃÃo gaussiana, o que normalmente nÃo ocorre na prÃtica. Portanto para o uso da aprendizagem Bayesiana à necessÃrio que as variÃveis sejam discretizadas segundo algum critÃrio, que no caso mais simples pode ser uma discretizaÃÃo uniforme. A grande maioria dos mÃtodos de discretizaÃÃo existentes, porÃm, nÃo sÃo adequados à aprendizagem Bayesiana, pois foram desenvolvidos no contexto de classificaÃÃo e nÃo de descoberta de conhecimento. Nesse trabalho à proposto e utilizado um mÃtodo de discretizaÃÃo de variÃveis que leva em conta as distribuiÃÃes condicionais das mesmas no processo de discretizaÃÃo, objetivando um melhor resultado do processo de aprendizagem Bayesiana. O mÃtodo proposto foi utilizado em uma base de dados real de informaÃÃes de ProteÃÃo ao VÃo e a rede Bayesiana construÃda foi utilizada no auxÃlio à validaÃÃo de dados, realizando uma triagem automatizada dos dados. Foi realizada uma comparaÃÃo entre o mÃtodo proposto de discretizaÃÃo e um dos mÃtodos mais comuns. Os resultados obtidos mostram a efetividade do mÃtodo de discretizaÃÃo proposto e apontam para um grande potencial dessa nova aplicaÃÃo da aprendizagem e inferÃncia Bayesiana.

ASSUNTO(S)

anÃlise estatÃstica multivariada teorema de bayes funÃÃes de distribuiÃÃo de probabilidades validaÃÃo

Documentos Relacionados