Modulo frontal para um sistema de reconhecimento automatico de voz

AUTOR(ES)
DATA DE PUBLICAÇÃO

1990

RESUMO

Este trabalho descreve o desenvolvimento do software para o Módulo Frontal de um Sistema de Reconhecimento Automático de Voz para operação na faixa de 0-4 kHz. O Módulo FrontaI , ou Processador Acústico, é responsável pela extração de traços a caracterização dos diversos sons da fala. O sinal de voz sofre uma filtragem passa-baixas com corte em 3,4 kHz, é amostrado a 8,0 kHz e quantizado em 12 bits. As análises são feitas em quadros de 25 ms, deslocados a um passo de 5 ms, obtendo-se uma série de parâmetros, como o número de cruzamentos por zero, o período de pitch para os intervalos sonoros, a energia em diversas faixas de freqüência do espectro LPC (Linear Predictive Coding) e a freqüência, amplitude e largura de faixa dos três primeiros formantes. O quadro é classificado em uma dentre sete categorias: silêncio, fricativo surdo, fricativo sonoro, oclusão sonora, vocálico, coarticulação eu indefinido. Esta última categoria inclui segmentos que não podem ser confiavelmente classificados em nenhuma das outras categorias. A classificação é independente do locutor.

ASSUNTO(S)

reconhecimento automatico da voz

Documentos Relacionados