Uma estratégia híbrida para o problema de classificação multirrótulo

AUTOR(ES)
FONTE

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia

DATA DE PUBLICAÇÃO

29/03/2011

RESUMO

Este trabalho apresenta um novo método para resolver o problema de classificação multirrótulo, baseado no método de enxame de partículas, chamado Multi Label K-Nearest Michigam Particle Swarm Optimization (ML-KMPSO), que foi avaliado utilizando-se duas bases de dados reais. A aprendizagem multirrótulo se originou na categorização de textos, onde cada documento pode pertencer a várias classes simultaneamente. Neste trabalho é proposta uma nova abordagem híbrida, na qual o ML-KMPSO se enquadra. Esta abordagem é baseada em duas estratégias. A primeira estratégia é a divisão do problema multirrótulo em diversos problemas binários, sendo que para tal foi utilizado o Michigan Particle Swarm Optimization (MPSO) para resolvê-los, porém, esta estratégia não leva em consideração as correlações existentes entre as classes. Já a segunda estratégia tem como objetivo considerar as correlações existentes entre as classes utilizando o Multi Label K-Nearest Neighbor (ML-KNN). Avaliamos a performance do ML-KMPSO utilizando a base Yeast (classificação funcional de genes) e a base Scene (classificação semântica de cenas). Os resultados obtidos pelo ML-KMPSO se igualam ou superam algoritmos de classificação multirrótulo do estado da arte

ASSUNTO(S)

computação teses.

Documentos Relacionados