Extracting semantic relations via analysis of correlated terms in documents / Extração de relações semanticas via análise de correlação de termos em documentos
AUTOR(ES)
Sergio William Botero
DATA DE PUBLICAÇÃO
2008
RESUMO
Sistemas de recuperação de informação são ferramentas para automatizar os procedimentos de busca por informações. Surgiram com propostas simples nas quais a recuperação era baseada exclusivamente na sintaxe das palavras e evoluíram para sistemas baseados na semântica das palavras como, por exemplo, os que utilizam ontologias. Entretanto, a especificação manual de ontologias é uma tarefa extremamente custosa e sujeita a erros humanos. Métodos automáticos para a construção de ontologias mostraram-se ineficientes, identificando falsas relações semânticas. O presente trabalho apresenta uma técnica baseada em processamento de linguagem natural e um novo algoritmo de agrupamento para a extração semi-automática de relações que utiliza o conteúdo dos documentos, uma ontologia de senso comum e supervisão do usuário para identificar corretamente as relações semânticas. A proposta envolve um estágio que utiliza recursos lingüísticos para a extração de termos e outro que utiliza algoritmos de agrupamento para a identificação de conceitos e relações semânticas de instanciação entre termos e conceitos. O algoritmo proposto é baseado em técnicas de agrupamento possibilístico e de bi-agrupamento e permite a extração interativa de conceitos e relações. Os resultados são promissores, similares às metodologias mais recentes, com a vantagem de permitir a supervisão do processo de extração
ASSUNTO(S)
processamento de textos (computação) sistemas de recuperação da informação semantic information retrieval system information retrieval ontology ontologia text processing (computation) semantica recuperação da informação
ACESSO AO ARTIGO
http://libdigi.unicamp.br/document/?code=000437630Documentos Relacionados
- Health human resource policy: an Analysis of Health Ministry Documents.
- Registro de imagens de documentos antigos.
- EGO-DOCUMENTOS NA FICÇÃO CONTEMPORÂNEA
- TIPOLOGIAS SEMÂNTICAS DE ADVÉRBIOS: UM ESTUDO COMPARATIVO
- The effect of using different forms of terms extraction on its comprehensibility and representability in Portuguese textual domains