Classificação de dados estacionários e não estacionários baseada em grafos / Graph-based classification for stationary and non-stationary data
AUTOR(ES)
João Roberto Bertini Júnior
DATA DE PUBLICAÇÃO
2011
RESUMO
Métodos baseados em grafos consistem em uma poderosa forma de representação e abstração de dados que proporcionam, dentre outras vantagens, representar relações topológicas, visualizar estruturas, representar grupos de dados com formatos distintos, bem como, fornecer medidas alternativas para caracterizar os dados. Esse tipo de abordagem tem sido cada vez mais considerada para solucionar problemas de aprendizado de máquina, principalmente no aprendizado não supervisionado, como agrupamento de dados, e mais recentemente, no aprendizado semissupervisionado. No aprendizado supervisionado, por outro lado, o uso de algoritmos baseados em grafos ainda tem sido pouco explorado na literatura. Este trabalho apresenta um algoritmo não paramétrico baseado em grafos para problemas de classificação com distribuição estacionária, bem como sua extensão para problemas que apresentam distribuição não estacionária. O algoritmo desenvolvido baseia-se em dois conceitos, a saber, 1) em uma estrutura chamada grafo K-associado ótimo, que representa o conjunto de treinamento como um grafo esparso e dividido em componentes; e 2) na medida de pureza de cada componente, que utiliza a estrutura do grafo para determinar o nível de mistura local dos dados em relação às suas classes. O trabalho também considera problemas de classificação que apresentam alteração na distribuição de novos dados. Este problema caracteriza a mudança de conceito e degrada o desempenho do classificador. De modo que, para manter bom desempenho, é necessário que o classificador continue aprendendo durante a fase de aplicação, por exemplo, por meio de aprendizado incremental. Resultados experimentais sugerem que ambas as abordagens apresentam vantagens na classificação de dados em relação aos algoritmos testados
ASSUNTO(S)
aprendizado baseado em grafos aprendizado incremental classificação multiclasse classificação não paramétrica concept drift formação do grafo grafo k-associado graph formation graph-based learning incremental learning k-associated graph medida de pureza mudança de conceito multi-class classification nonparametric classification purity measure
Documentos Relacionados
- Treatment of geophysical data as a non-stationary process
- Graph-based iterative Group Analysis enhances microarray interpretation
- UMA ABORDAGEM SEQÜENCIAL ESPECTRAL NO ESTUDO DE SÉRIES TEMPORAIS NÃO ESTACIONÁRIAS
- Classificação imprecisa de dados baseada em lógica difusa e teoria de possibilidades
- Classificação imprecisa de dados baseada em lógica difusa e teoria de possibilidades