Extração semântica de dados semi-estruturados através de exemplos e ferramentas visuais
AUTOR(ES)
Silveira, Iraci Cristina da
DATA DE PUBLICAÇÃO
2007
RESUMO
Existe uma necessidade latente de pesquisar, filtrar e manipular informações disponíveis em diversos formatos irregulares, entre elas as informações distribuídas na WWW (World Wide Web). Esses tipos de dados são semi-estruturados, pois não possuem uma estrutura explícita e regular, o que dificulta sua manipulação. Este trabalho apresenta como proposta o projeto de uma ferramenta para realizar a extração semântica e semi-automática de dados semi-estruturados. O usuário especifica, através de uma interface visual, um exemplo da estrutura hierárquica do documento e de seu relacionamento com os conceitos da ontologia, gerando uma gramática descritiva da estrutura implícita do mesmo. A partir dessa gramática, a ferramenta realiza a extração dos próximos documentos de forma automática, reestruturando o resultado em um formato regular de dados, neste caso, XML (eXtensible Markup Language). Além da conceituação do método de extração, são apresentados os experimentos realizados com o protótipo da ferramenta, bem como, os resultados obtidos nestes experimentos. Para a construção desta ferramenta, são analisadas características de outros métodos que constituem o estado da arte em extração de dados semi-estruturados.
ASSUNTO(S)
armazenamento : dados recuperacao : informacao banco : dados semi-estruturados extração semântica
ACESSO AO ARTIGO
http://hdl.handle.net/10183/2178Documentos Relacionados
- Estratégias baseadas em exemplos para extração de dados semi-estruturados da web
- AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
- Um processo auto-documentável de geração de ontologias de domínio para dados semi-estruturados
- Uma técnica de indexação de dados semi-estruturados para o processamento eficiente de consultas com ramificação
- Desvio tangencial de obstáculos para um robô móvel navegando em ambientes semi-estruturados