Uma abordagem evolucionária para aprendizado semi-supervisionado em máquinas de vetores de suporte

AUTOR(ES)
FONTE

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia

DATA DE PUBLICAÇÃO

21/11/2008

RESUMO

O paradigma de Aprendizado Semi-Supervisionado é bastante adequado a uma classe de problemas de crescente relevância no contexto do Aprendizado de Máquinas: aqueles onde há um grande desbalanceamento entre o conjunto de treinamento e o de teste, devido, entre outras coisas, ao alto custo de um classificador. Nessa classe de problemas, não se pode assegurar que os padrões rotulados representem adequadamente o sistema a ser aprendido, restringindo o uso do paradigma Indutivo Supervisionado. Utilizam-se, então, os padrões não-rotulados como fonte alternativa de informação sobre o problema a ser resolvido, garantindo maior capacidade de generalização à solução obtida. As Máquinas de Vetores de Suporte (SVMs) são Redes Neurais Artificiais de ampla aceitação pela comunidade de Inteligência Computacional. Sua formulação baseada na Teoria do Aprendizado Estatístico e na maximização da margem de separação confere às SVMs altíssima capacidade de generalização. As TSVMs (Transductive Support Vector Machines) ampliam a formulação das SVMs para a aplicação em problemas de aprendizado Semi-Supervisionado. Entretanto, a procura pelo conjunto de classificações que maximiza a margem de separação entre ambos os conjuntos de treinamento e de teste é realizada através de uma busca local exaustiva. A não-otimalidade desse processo motivou o desenvolvimento das GA3SVMs (Genetic Algorithm Semi-Supervised Support Vector Machines), propostas no presente trabalho. Introduz-se, aqui, um Algoritmo Evolucionário na busca pelas classificações ótimas para os padrões de teste, de forma a induzir uma solução de separação máxima e alta capacidade de generalização. Um operador de mutação modificado, inspirado no método transdutivo k-Nearest Neighbors, é também apresentado, o qual adiciona informação ao processo de busca e acelera significativamente a convergência do Algoritmo Genético utilizado. Os resultados obtidos mostram a superioridade da metodologia proposta quando comparada às TSVMs tradicionais, para a classe de problemas estudada.

ASSUNTO(S)

engenharia elétrica teses.

Documentos Relacionados