A ordenação das variáveis no processo de otimização de classificadores bayesianos: uma abordagem evolutiva

AUTOR(ES)
DATA DE PUBLICAÇÃO

2007

RESUMO

Classificação é uma tarefa importante em análises de dados e reconhecimento de padrões e requer a construção de um classificador. A indução de classificadores a partir de um conjunto de dados é um problema importante em aprendizado de máquina. Diversas abordagens para a resolução deste problema se baseiam em várias representações, como árvores de decisão, redes neurais, grafos de decisão e regras. Entretanto, têm crescido bastante o interesse em métodos Bayesianos para classificação. Os algoritmos de aprendizado de redes Bayesianas podem ser usados para induzir classificadores Bayesianos. Contudo, o aprendizado de redes Bayesianas a partir de dados é um problema NP-Completo e não há métodos computacionais capazes de identificar a melhor solução para todos os problemas de aplicação. Uma restrição comum nestes algoritmos de aprendizado é a ordenação prévia das variáveis utilizadas na definição do problema. As ordenações das variáveis representam os possíveis relacionamentos entre as variáveis na formação da estrutura da rede Bayesiana que descreve o problema. Utilizando uma ordenação adequada das variáveis, os algoritmos de aprendizado são capazes de encontrar uma solução mais eficiente. Sendo assim, são propostos, neste trabalho, métodos híbridos para identificar uma ordenação adequada de variáveis, visando à otimização do aprendizado de redes Bayesianas para a tarefa de classificação. Os métodos propostos, chamados de VOGA, VOGAC e VOEA, utilizam algoritmos evolucionários e algoritmos de aprendizado de redes Bayesianas. Estes métodos usam a informação da variável classe na definição da ordenação mais adequada. Os experimentos executados em alguns domínios de bases de dados revelaram que os métodos propostos são promissores

ASSUNTO(S)

aprendizado do computador algoritmos genéticos redes bayesianas ciencia da computacao

Documentos Relacionados