Uma proposta de interface de consulta para recuperação de informação em documentos semi-estruturados
AUTOR(ES)
Mirella Silva Junqueira
DATA DE PUBLICAÇÃO
2009
RESUMO
A Recuperação Semi-Estruturada é uma forma de recuperação de informação intermediária entre a Recuperação Textual e a Recuperação Estruturada (típica em sistemas de banco de dados relacionais). Em sistemas de recuperação estruturada, o usuário geralmente conhece a estrutura dos dados e as linguagens de consulta disponíveis, conseguindo assim formular consultas que produzem resultados mais precisos. Na Recuperação Textual o usuário não conhece a estrutura dos dados e formula as consultas apenas com palavraschaves, as quais geram resultados não tão precisos. Na Recuperação Semi-Estruturada, o usuário geralmente desconhece a estrutura dos dados e formula consultas que mesclam buscas textuais e mecanismos de recuperação estruturada. Neste contexto, surge o problema de como melhorar a precisão dos resultados aproveitando a estrutura contida nos documentos semi-estruturados. Dados semi-estruturados são comummente armazenados como documentos XML, os quais podem ser vistos como árvores. Nós internos dessas árvores contem a estrutura do documento enquanto os nós folhas contêm os dados. O projeto de interfaces para usuários neste contexto é um dos grandes desafios na recuperação semi-estruturada. Isso ocorre especialmente porque os usuários não conhecem a estrutura do documento e têm dificuldade na formulação de consultas estruturadas. Este trabalho apresenta uma proposta e um protótipo de interface desenvolvido para auxiliar os usuários no processo de formulação de consultas estruturadas. Pretende-se com isso aumentar a precisão nos resultados das consultas. A proposta é validada por meio de experimentos envolvendo usuários voluntários e pela comparação de resultados obtidos com consultas textuais e consultas estruturadas formuladas com o auxílio da ferramenta. A melhoria atinge 440% para consultas bem estruturadas, realizadas por usuário que conhece bem a interface, e 179,75% para consultas razoavelmente estruturadas, realizadas por usuários sem experiência no uso da interface.
ASSUNTO(S)
recuperação de informação recuperação semiestruturada xml banco de dados semi-structured information retrieval interfaces homem-máquina information retrieval ciencia da computacao human-machine interfaces database
ACESSO AO ARTIGO
http://www.bdtd.ufu.br//tde_busca/arquivo.php?codArquivo=2516Documentos Relacionados
- Estratégias baseadas em exemplos para extração de dados semi-estruturados da web
- Desvio tangencial de obstáculos para um robô móvel navegando em ambientes semi-estruturados
- Uma técnica de indexação de dados semi-estruturados para o processamento eficiente de consultas com ramificação
- AUTOMATIC CLASSIFICATION OF SEMI-STRUCTURED DATA
- Um processo auto-documentável de geração de ontologias de domínio para dados semi-estruturados