Tradução automática estatística baseada em sintaxe e linguagens de árvores
AUTOR(ES)
Daniel Emilio Beck
FONTE
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia
DATA DE PUBLICAÇÃO
19/06/2012
RESUMO
A Tradução Automática (Machine Translation - MT) é uma das aplicações clássicas dentro do Processamento da Língua Natural (Natural Language Processing - NLP). O estado-da-arte em MT é representado por métodos estatísticos, que buscam aprender o conhecimento linguístico necessário de forma automática por meio de grandes coleções de textos (os corpora). Entretanto, ainda que se tenha avançado bastante em relação à qualidade de sistemas estatísticos de MT, hoje em dia esses avanços não estão sendo significativos. Por conta disso, as pesquisas na área têm buscado formas de envolver mais conhecimento linguístico explícito nesses sistemas. Um dos problemas que não é bem resolvido por sistemas de MT puramente estatísticos é o correto tratamento de fenômenos sintáticos. Assim, uma das direções que as pesquisas tomam na hora de incorporar conhecimento linguístico a esses sistemas é através da adição de regras sintáticas. Para isso, uma série de métodos e formalismos foram e são estudados até hoje. Esse texto apresenta a investigação de métodos que se utilizam de informação sintática na tentativa de avançar no estado-da-arte da MT estatística. Foram utilizados métodos e formalismos que lidam com linguagens de arvores, em especial as Gramáticas de Substituição de Árvores (Tree Substitution Grammars - TSGs) e os Transdutores Árvore-para-String (Tree-to-String - TTS). Desta investigação, obteve-se maior entendimento sobre os formalismos estudados e seu comportamento em aplicações de NLP.
ASSUNTO(S)
processamento da linguagem natural (computação) linguística - processamento de dados linguagem - tradução automática processamento da língua natural tradução automática estatística gramáticas de substituição de árvores natural language processing linguística computacional transdutores árvore-para-string ciencia da computacao computational linguistics statistical machine translation tree substitution grammars tree-to-string transducers
ACESSO AO ARTIGO
http://www.bdtd.ufscar.br/htdocs/tedeSimplificado//tde_busca/arquivo.php?codArquivo=5385Documentos Relacionados
- ClassificaÃÃo automÃtica de cardiopatias baseada em eletrocardiograma
- TRADUÇÃO AUTOMÁTICA: QUESTÕES DE ENSINO E APRENDIZAGEM
- Geração automática de testes a partir de descrições de linguagens
- Especialização de linguagens orientadas a aspectos baseada em extensibilidade de gramáticas
- Sumarização automática de rushes vídeos baseada em características espaciais e espaço-temporais