Um estudo comparativo de ferramentas de descoberta de conhecimento em texto: a análise da Amazônia
AUTOR(ES)
Silva, Ana Carla Macedo da
DATA DE PUBLICAÇÃO
2007
RESUMO
Este trabalho faz avaliação de ferramentas que utilizam técnica de Descoberta de Conhecimento em Texto (agrupamento ou “clustering”). As duas ferramentas são: Eurekha e Umap. O Eurekha é baseado na hipótese de agrupamento, que afirma que documentos similares e relevantes ao mesmo assunto tendem a permanecer em um mesmo grupo. O Umap, por sua vez, é baseado na árvore do conhecimento. A mesma coleção de documentos submetida às ferramentas foi lida por um especialista humano, que agrupou textos similares, a fim de que seus resultados fossem comparados aos das ferramentas. Com isso, pretende-se responder a seguinte questão: a recuperação automática é equivalente à recuperação humana? A coleção de teste é composta por matérias do jornal Folha de São Paulo, cujo tema central é a Amazônia. Com os resultados, pretende-se verificar a validade das ferramentas, os conhecimentos obtidos sobre a região e o tratamento que o jornal dá em relação à mesma.
ASSUNTO(S)
recuperacao : informacao descoberta : conhecimento
ACESSO AO ARTIGO
http://hdl.handle.net/10183/4279Documentos Relacionados
- Descoberta de conhecimento em texto aplicada a um sistema de atendimento ao consumidor
- Estudo comparativo de ferramentas modernas de análise aplicadas à qualidade da energia elétrica
- A interlocução no processo de construção do texto: um enfoque interacional
- Correção de texto: um desafio para o professor de Português
- Música e texto : um estudo comparativo da aquisição de vocabulário em língua estrangeira