CARACTERIZAÇÃO DA COMPLEMENTARIDADE TEMPORAL: SUBSÍDIOS PARA SUMARIZAÇÃO AUTOMÁTICA MULTIDOCUMENTO
AUTOR(ES)
SOUZA, Jackson Wilke da Cruz, FELIPPO, Ariani Di
FONTE
Alfa, rev. linguíst. (São José Rio Preto)
DATA DE PUBLICAÇÃO
2018-03
RESUMO
RESUMO A complementaridade é um fenômeno multidocumento comumente observado entre notícias que versam sobre um mesmo evento. A partir de um corpus em português composto por um conjunto de pares de sentenças manualmente anotadas com as relações da Cross-Document Structure Theory (CST) que explicitam a complementaridade temporal (Historical background e Follow-up), identificou-se um conjunto potencial de atributos linguísticos desse tipo de complementaridade. Por meio de algoritmos de Aprendizado de Máquina, testou-se o potencial dos atributos em distinguir as referidas relações. O classificador simbólico gerado pelo algoritmo JRip obteve o melhor desempenho ao se considerar a precisão e o tamanho reduzido do conjunto de regras. Somente com base em 5 regras, tal classificador identificou Follow-up e Historical background com precisão aproximada de 80%. Ademais, as regras do classificador indicam que o atributo ocorrência de expressão temporal na sentença 2 é o mais relevante para a tarefa. Como contribuição, salienta-se que o classificador JRip aqui gerado pode ser utilizado nos analisadores discursivos multidocumento para o português do Brasil que são baseados na CST.
ASSUNTO(S)
descrição linguística complementaridade cst sumarização multidocumento processamento automático de língua natural
Documentos Relacionados
- Processamento temporal: sua importância para aprendizagem da leitura
- Sumarização automática multidocumento: seleção de conteúdo com base no Modelo CST (Cross-document Structure Theory)
- Cistos da fissura coroidal temporal e epilepsia do lobo temporal: dois relatos de casos
- Sumarização automática de rushes vídeos baseada em características espaciais e espaço-temporais
- Epilepsia do lobo temporal: mecanismos e perspectivas