Uso de corpora comparáveis para filtrar dicionários bilíngues gerados por transitividade
AUTOR(ES)
GAMALLO, Pablo
FONTE
DELTA
DATA DE PUBLICAÇÃO
2014-12
RESUMO
Este artigo propõe um método para a construção de novos dicionários bilíngues a partir de dicionários já existentes e da exploração de corpora comparáveis. Mais concretamente, um novo dicionário para um par de línguas é gerado em duas etapas: primeiro, cruzam-se dicionários bilíngues entre essas línguas e uma terceira intermediária e, segundo, o resultado do cruzamento, que contém um número elevado de traduções espúrias causadas pela ambiguidade das palavras da língua intermediária, filtra-se com apoio em textos de temática comparável nas duas línguas alvo. A qualidade do dicionário derivado é muito alta, próxima dos dicionários construídos manualmente. Descreveremos um caso de estudo onde criaremos um novo dicionário Inglês-Português com mais de 7.000 entradas bilíngues geradas pelo nosso método.
ASSUNTO(S)
processamento da língua natural extração de informação corpora comparáveis dicionários bilíngues
Documentos Relacionados
- Comparação de fraseologismos franceses em dicionários bilíngues brasileiros
- Estudo metalexicográfico de falsos amigos do português em relação ao espanhol em dicionários bilíngues gerais e em dicionários de falsos amigos
- Palavras malsonantes em dicionários bilíngües escolares espanhol-português : uma proposta de marcação
- Uma reflexão sobre a elaboração de um léxico bilíngüe preliminar na subárea de cardiologia a partir do uso de termos encontrados em um corpus paralelo e em dois corpora comparáveis
- Uma comparação do tratamento de expressões idiomáticas em quatro dicionários bilíngues francês /português e português