Estratégias para busca do texto completo de artigos catalogados em uma biblioteca digital

AUTOR(ES)
DATA DE PUBLICAÇÃO

2007

RESUMO

Esta dissertação propõe um processo que utiliza resultados de consultas submetidas a máquinas de busca para encontrar a URL do texto completo correspondente, ou de qualquer outro material relacionado, a artigos catalogados em uma biblioteca digital que não possuem tal informação registrada. Apresentamos um estudo desse processo para investigar diferentes estratégias de consultas aplicadas a três máquinas de busca de propósito geral (Google, Yahoo!, MSN) e a duas especializadas (Scholar e CiteSeer) considerando vários cenários caracterizados por usuários com diferentes níveis de exigências. Especificamente, conduzimos um conjunto de experimentos com artigos provenientes da BDBComp - Biblioteca Digital Brasileira de Computação e da DBLP - Digital Bibliography &Library Project. De acordo com os resultados, Scholar mostrou-se mais eficaz nesta tarefa do que as outras máquinas de busca testadas em todos os cenários estudados. Além disso, nossos experimentos mostraram que estratégias simples para combinação e reordenação fornecem resultados ainda melhores. Nosso estudo também apresenta uma análise do impacto de diferentes fatores na chance de se encontrar o texto completo dos artigos procurados.

ASSUNTO(S)

world wide web (sistema de recuperação da informação) teses. recuperação da informação teses. sistemas de recuperação da informação teses. computação teses. bibliotecas digitais teses.

Documentos Relacionados