Ranking of publications based on extraction of texts of the Internet / Ranking de publicações baseado na extração de textos da Internet
AUTOR(ES)
Henrique Przibisczki de Oliveira
DATA DE PUBLICAÇÃO
2009
RESUMO
Vários métodos de ranking atuais comparam os diversos veículos de publicação em relação à qualidade ou impacto. Esta informação é muito importante para que um pesquisador selecione veículos de renome para publicar suas pesquisas, ou mesmo, instituições podem promover seus pesquisadores baseando-se na qualidade dos veículos onde publicam. Esta informação sobre os veículos pode também ser valiosa para um governo destinar recursos `as instituições ou uma empresa avaliar a qualidade de um candidato a um emprego. Existem várias métricas distintas para realizar ranking de veículos, mas o ponto comum entre a maioria é o uso de citações. Portanto, por mais que um veículo seja bastante prestigiado pelos pesquisadores, se ele não for indexado em uma base sua qualidade não será considerada. Este trabalho propõe um método para ranking de veículos de publicação obtendo as informações não de uma base de citações existente, mas de uma outra fonte de dados: a Web. As páginas dos professores de universidades são visitadas e delas são extraídas as suas publicações. De cada publicação é extraído o veículo e dessa forma, baseado nos veículos que um pesquisador quis exibir em sua página, os mesmos são ordenados. Este método irá contemplar veículos de publicação não existentes nas atuais bases de dados criando um novo ranking de publicações. Vários problemas computacionais interessantes são abordados neste trabalho: busca de informação na internet, segmentação textual, extração de componentes em uma referência bibliográfica e agrupamento
ASSUNTO(S)
science publishing referencias bibliograficas recuperação da informação classificações bibliograficas bibliometrics bibliometria indexação automatica publicações cientificas bibliographic classification automatic indexing information retrieval
ACESSO AO ARTIGO
http://libdigi.unicamp.br/document/?code=000477491Documentos Relacionados
- Fingerprint Identification Based on Minutiae Extraction
- A stream scheduling scheme based on local regularity of internet traffic
- Um modelo de fusão de rankings baseado em análise de preferência
- Método de extração da posição de máquinas agrícolas por visão computacional baseado em redes pulsadas e ponto de fuga
- Semi-automatic method for the construction of partial domain ontologies based on texts.