AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA / CLASSIFICAÇÃO AUTOMÁTICA DE DADOS SEMI-ESTRUTURADOS
AUTOR(ES)
BERNARDO PEREIRA NUNES
DATA DE PUBLICAÇÃO
2009
RESUMO
The problem of data classification goes back to the definition of taxonomies covering knowledge areas. With the advent of the Web, the amount of data available has increased several orders of magnitude, making manual data classification impossible. This dissertation proposes a method to automatically classify semi-structured data, represented by frames, without any previous knowledge about structured classes. The dissertation introduces an algorithm, based on K-Medoid, capable of organizing a set of frames into classes, structured as a strict hierarchy. The classification of the frames is based on a closeness criterion that takes into account the attributes and their values in each frame.
ASSUNTO(S)
ACESSO AO ARTIGO
Documentos Relacionados
- Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
- Estratégias baseadas em exemplos para extração de dados semi-estruturados da web
- Um processo auto-documentável de geração de ontologias de domínio para dados semi-estruturados
- Uma técnica de indexação de dados semi-estruturados para o processamento eficiente de consultas com ramificação
- Semi-automatic classification of Java components