Aprendizado semissupervisionado aplicado ao problema de valores ausentes

AUTOR(ES)
FONTE

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia

DATA DE PUBLICAÇÃO

29/05/2012

RESUMO

Valores ausentes constituem um problema relativamente comum em bases de dados, devido a isso existem vários métodos para estimá-los. Essa estimativa é denominada imputação de valores ausentes. Os métodos que usam o aprendizado de máquina para realizar a tarefa imputação, costuman ser supervisionados e somente utilizam os exemplos rotulados para indução de hipotese, e desta forma não conseguem usar a informação contida nos dados não rotulados. Perdendo assim, uma potencial fonte de conhecimento. O aprendizado semissupervisionado é um paradigma de aprendizado que pode se valer tanto de dados não rotulados quanto de dados rotulados e desta maneira, teoricamente, obter um melhor desempenho em tarefas de imputação. Isso porque uma base de dados com atributos ausentes pode ser dividida em dados rotulados (exemplos sem atributos com valores ausentes) e não rotulados (exemplos com atributos com valores ausentes). Nesta dissertação é demonstrado que a imputação de dados em bases estáticas é uma tarefa de natureza intrinsicamente transdutiva e por ser a inferência trandutiva um conceito muito próximo ao aprendizado semissupervisionado é esperado que o aprendizado semissupervisionado obtenha um melhor desempenho em tarefas de imputação que outros paradigmas. Os experimentos realizados utilizando algoritmos semissupervisionados multivisão como o TRI-TRAINING com e sem seleção automática do classificador base, mostram resultados promissores quando comparados com os classificadores supervisionados J48, IBK (k-NN), naive Bayes e SMO (SVM) . Isso demonstra que o aprendizado semissupervisionado é uma boa opção para tarefas de imputação de valores ausentes. Palavras-chave: aprendizado semissupervisionado, imputação de valores ausentes, algoritmos multivisão, seleção automática de classificadores.

ASSUNTO(S)

aprendizado do computador inteligência artificial computação ciencia da computacao machine learning artificial intelligence computer science

Documentos Relacionados