Utilizando Evidência da wikipedia para relacionar textos a lugares

AUTOR(ES)
FONTE

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia

DATA DE PUBLICAÇÃO

29/07/2011

RESUMO

Dado que uma parcela significativa de buscas na Web apresenta alguma intenção geográfica, é importante conceber formas automáticas de associar recursos a lugares (geotagging). O presente trabalho propõe duas estratégias para geotagging de textos usando a Wikipedia como fonte de evidência geográfica. Primeiro, propõe-se a classificação automática de textos com base na ocorrência de palavras-chave extraídas da Wikipedia para um conjunto de lugares. Em seguida, é proposto basear-se numa técnica de identificação de tópicos auxiliada pela Wikipedia, onde os tópicos encontrados conectam textos ao grafo da Wikipedia, permitindo a busca por lugares relacionados. Experimentos avaliaram a precisão do geotagging em uma coleção de documentos associados a estados brasileiros. Demonstrou-se a viabilidade do uso da Wikipedia como fonte de evidência geográfica, beneficiando-se de seu conhecimento livre, amplo e atualizado e apresentando uma alternativa ou extensão aos dicionários geográficos(gazetteers) em tarefas de recuperação de informação geográfica.

ASSUNTO(S)

computação teses. sistemas de informação geografica teses. sistemas de recuperação da informação teses.

Documentos Relacionados