Combinação de classificadores na categorização de textos
AUTOR(ES)
Gustavo Sandini Linden
DATA DE PUBLICAÇÃO
2007
RESUMO
Este trabalho apresenta e avalia uma proposta para Categorização Hierárquica de Textos com uso combinado dos classificadores k-Nearest Neighbors (k-NN) e Support Vector Machines (SVM). O estudo foi embasado numa série de experimentos os quais fizeram uso da coleção Folha-RIcol de textos em língua portuguesa, que se encontram hierarquicamente organizados em categorias. Nos experimentos realizados, os classificadores k-NN e SVM tiveram seu desempenho analisado, primeiro individualmente, com uma variante da metodologia de avaliação hold-out, e após, de modo combinado. A combinação proposta, denominada k-NN+SVM, teve seu desempenho comparado com aquele dos classificadores individuais e com o da combinação por voto. Em síntese, a combinação k-NN+SVM não apresentou desempenho superior às demais alternativas, todavia o estudo permitiu a observação do comportamento dos classificadores e seu uso combinado, a identificação de problemas e possíveis soluções, bem como algumas considerações sobre a coleção de documentos utilizada
ASSUNTO(S)
lingÜÍstica computacional ciencia da computacao categorizaÇÃo (lingÜística) processamento de textos (computaÇÃo) informÁtica aprendizagem de mÁquina
ACESSO AO ARTIGO
http://tede.pucrs.br/tde_busca/arquivo.php?codArquivo=1828Documentos Relacionados
- Combinação de classificadores para inferência dos rejeitados
- Combinação de múltiplos classificadores para reconhecimento de face humana
- Aprendizagem de máquina baseada na combinação de classificadores em bases de dados de área de saúde
- Combinação de múltiplos classificadores para identificação de materiais em imagens ruidosas.
- Maratona Atenas 2004: a (re)categorização em textos jornalísticos