Estudo e validação de teorias do domínio lingüístico com vistas à melhoria do tratamento de cadeias de co-referência em Sumarização Automática.
AUTOR(ES)
Thiago Ianez Carbonel
DATA DE PUBLICAÇÃO
2007
RESUMO
The work presented in the dissertation focuses on the study and validation of linguistic theories so as to improve reference cohesion in Automatic Summarization systems, which with the advent of the Internet have received increasing attention due to the urge to manage the huge amounts of on-line textual information that become available each day. In this dissertation we evaluate Seno (2005)s Veins Theory-based proposal and prototype, and present a reimplementation with distinct features based on the analysis of a corpus annotated with rhetoric (RST) and referential information. In addition, we report on the first validation effort for Portuguese for Veins Theorys Conjecture 1 (C1), which constrains anaphora resolution given the rhetoric structure of texts and whose applicability to Automatic Summarization interests us. As a methodological novelty, we put forth the Non-Trivial Precision, a more realistic estimator of C1s predictive power.
ASSUNTO(S)
linguistica textualidade sumarização automática lingüística processamento de dados anáfora (lingüística)
ACESSO AO ARTIGO
http://www.bdtd.ufscar.br/htdocs/tedeSimplificado//tde_busca/arquivo.php?codArquivo=1601Documentos Relacionados
- Obtenção do coeficiente de cultura da goiabeira com a utilização do balanço de energia e estações agrometeorológicas convencional e automática.
- Sumarização automática de rushes vídeos baseada em características espaciais e espaço-temporais
- Um estudo comparativo de modelos baseados em estatísticas textuais, grafos e aprendizado de máquina para sumarização automática de textos em português
- Diagnóstico de Fragilidades na Gestão Educacional Paulista com Vistas à Melhoria
- Emotion and automatic dialogue summarisation