TÃcnicas de parsing para gramÃtica livre de contexto lexicalizada da lÃngua portuguesa.

AUTOR(ES)
DATA DE PUBLICAÇÃO

2004

RESUMO

Este trabalho apresenta algoritmos de reconhecimento e parsing para um subconjunto da GramÃtica Livre de Contexto Lexicalizada (GLCL) da lÃngua portuguesa. A GLCL apresentada neste trabalho estende o domÃnio de localidade de uma GramÃtica Livre de Contexto (GLC) do portuguÃs fazendo com que um item lexical (sÃmbolo terminal das gramÃticas formais) apareÃa como parte das estruturas elementares sem alterar as estruturas das Ãrvores utilizadas, o que à lingÃisticamente muito significativo. A GLCL à uma forma restrita da GramÃtica de AdjunÃÃo de Ãrvores Lexicalizada (LTAG) que pode somente gerar linguagens livres de contexto, mantendo limites de complexidade de ordem cÃbica, no pior caso, para o reconhecimento e parsing. Inicialmente, à apresentada uma introduÃÃo à Ãrea das Interfaces em Linguagem Natural para Banco de Dados (ILNBDs) referenciando as principais motivaÃÃes e problemas encontrados no uso destas. O trabalho tambÃm apresenta uma introduÃÃo ao processamento da linguagem natural, situando gramÃticas e analisadores sintÃticos, buscando inserir este trabalho em seu contexto. Para um embasamento teÃrico à descrito o formalismo das GLCLs, com suas caracterÃsticas, componentes, e operaÃÃes de combinaÃÃes entre os componentes. Os componentes principais do formalismo sÃo dois conjuntos de Ãrvores: Ãrvores iniciais, as quais sÃo combinadas por substituiÃÃo, e Ãrvores auxiliares, combinadas por uma forma restrita de adjunÃÃo.A seguir, à apresentado o subconjunto da lÃngua escolhida. Algumas famÃlias de Ãrvores foram descritas, mostrando um conjunto de oraÃÃes na voz ativa, passiva, oraÃÃes relativas, interrogativas e clivadas. A gramÃtica està descrita de acordo com o formalismo da GLCL. Finalmente, algoritmos de reconhecimento e parsing para a GLCL da lÃngua portuguesa serÃo desenvolvidos.

ASSUNTO(S)

matemÃtica computacional lÃngua portuguesa tÃcnicas de computaÃÃo algoritmos de leitura linguagem natural (computadores) linguagens livre de contexto reconhecimento de padrÃes algoritmos para anÃlise sintÃtica gramÃtica

Documentos Relacionados