Deverbais de ação em corpus histórico: contribuição computacional para a morfologia construcional do português

AUTOR(ES)
DATA DE PUBLICAÇÃO

2009

RESUMO

Nos últimos anos, têm-se desenvolvido trabalhos em morfologia construcional que visam à descrição dos mecanismos de construção de nomes deverbais, isto é, nomes derivados de verbos, numa perspectiva sincrônica. As razões para esse interesse podem encontrar-se na produtividade dos mecanismos de construção deste tipo de nomes, cujo impacto no uso do português, sobretudo em contextos formais de uso, não é irrelevante. Faltam, no entanto, estudos que nos permitam conhecer, por um lado, o Português do Brasil (PB) em nível destes mecanismos e, por outro, ter uma perspectiva diacrônica deles. Acreditamos que os mecanismos de construção atuais para o PB sejam iguais aos dos séculos XVI, XVII e XVIII, podendo existir alterações relacionadas aos sufixos mais produtivos e à mudança dos processos de construção mais produtivos para determinadas palavras. A realização do projeto Dicionário Histórico do Português do Brasil (DHPB) dos séculos XVI a XVIII, financiado pelo Programa Institutos do Milênio, associada à construção do corpus coligido para esse efeito constituem ao mesmo tempo um desafio e uma oportunidade para o aprofundamento do conhecimento sobre este aspecto da língua portuguesa. Por um lado, a análise do corpus dános a oportunidade de verificar como se processou a evolução destes mecanismos de construção no português. Porém (e este é o desafio), não existem ainda ferramentas para realizar tais pesquisas de forma (semi-) automática, que permitam aos morfologistas obter os dados necessários para o seu trabalho com agilidade e eficiência. O objetivo desta pesquisa de mestrado foi, em primeiro lugar, descrever os diferentes mecanismos de construção de nomes deverbais em PB de acordo com o modelo de morfologia construcional SILEX (cf. Corbin 1987, 1991, 1997, Correia 1999, Rio-Torto (org.) 2004 e Rodrigues 2006) e, em segundo, desenvolver um sistema computacional denominado EXTRADEV que permitiu um acesso fácil aos seguintes dados: (a) nomes deverbais de ação históricos com as mais diversas estruturas morfológicas; e (b) variantes gráficas desses nomes deverbais (históricos), que facilitem o trabalho de recuperação de informação relativa aos mesmos. A metodologia utilizada para a construção deste sistema se embasa: (i) na descrição dos deverbais e na contrução de regras; (ii) em um estudo piloto dos cinquenta verbos mais frequentes do corpus do projeto DHPB, extraídos por meio da ferramenta UNITEX e na análise das variantes gráficas destes verbos; (iii) no conhecimento da linguagem de programação Python e expressões regulares; e (iv) no uso de recursos criados no projeto DHPB, como o sistema de geração de variantes gráficas SIACONF. Foram encontrados 1.742.663 ocorrências de deverbais de ação e 15.633 formas distintas dos mesmos sem variação de grafia. Este número, mais as variantes extraídas no segundo módulo do EXTRADEV, somam um total de 22.442 ocorrências de deverbais históricos, sendo eles 6.809 variantes e 15.633 deverbais sem variação de grafia. Seguimos os seguintes critérios de análise: frequência, análise da estrutura morfológica com auxílio de dicionários históricos e etimológicos, e observação da lista final de deverbais históricos. Com este trabalho pretendemos contribuir para um melhor conhecimento da variação diacrônica na construção de nomes deverbais através dos dados que foram encontrados, mas, sobretudo, motivar a aliança entre linguística e a ciência da computação, particularmente o processamento de língua natural, de modo a potencializar estudos futuros sobre a língua portuguesa.

ASSUNTO(S)

linguística - processamento de dados nome deverbal corpus histórico morfologia construcional recuperação da informação semi-automática linguistica deverbal nouns historical corpus constructional morphology automatic recovery

Documentos Relacionados