Alinhamento léxico utilizando técnicas híbridas discriminativas e de pós-processamento / Text alignment
AUTOR(ES)
Schreiner, Paulo
DATA DE PUBLICAÇÃO
2011
RESUMO
O alinhamento léxico automático é uma tarefa essencial para as técnicas de tradução de máquina empíricas modernas. A abordagem gerativa não-supervisionado têm sido substituída recentemente por uma abordagem discriminativa supervisionada que facilite inclusão de conhecimento linguístico de uma diversidade de fontes. Dentro deste contexto, este trabalho descreve uma série alinhadores léxicos discriminativos que incorporam heurísticas de pós-processamento com o objetivo de melhorar o desempenho dos mesmos para expressões multi-palavra, que constituem um dos desafios da área de processamento de linguagens naturais atualmente. A avaliação é realizada utilizando um gold-standard obtido a partir da anotação de um corpus paralelo de legendas de filmes. Os alinhadores propostos apresentam um desempenho superior tanto ao obtido por uma baseline quanto ao obtido por um alinhador gerativo do estado-da-arte (Giza++), tanto no caso geral quanto para as expressões foco do trabalho.
ASSUNTO(S)
lingüística computacional natural language processing lexical alignment processamento : linguagem natural machine learning parallel corpora multiword expressions ufrgs
ACESSO AO ARTIGO
http://hdl.handle.net/10183/27658Documentos Relacionados
- Técnicas de pós-processamento em fibras de cristal fotônico
- Pós-processamento de imagens digitalizadas na odontometria de primeiros pré-molares superiores
- Apresentação de Software para Pós-processamento de Curvas de Deformação Cardíaca: D-Station
- Identificação de QTLs em milho associados à qualidade de sementes no pós-processamento
- Tecnicas de pos-processamento na simulação de fluxos monofasicos em meios porosos