Medida da relação harmônico/ruído em vozes disfônicas pelo processamento digital de imagens espectrográficas

AUTOR(ES)
FONTE

IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia

DATA DE PUBLICAÇÃO

09/06/2009

RESUMO

Este trabalho apresenta a S2NR, Spectrographic Signal-to-Noise Ratio, uma medida da relação sinal/ruído obtida através do processamento da imagem do espectrograma de uma vogal. O algoritmo utilizado baseia-se em ferramentas de identificação de impressões digitais, as quais apresentam traçados com linhas paralelas que se assemelham aos espectrogramas de vogais. Para validação do algoritmo, estabeleceu-se uma plataforma de testes que permite a síntese de diferentes vogais, com controle de freqüência fundamental, ruído branco aditivo e perturbações ciclo-a-ciclo na amplitude (shimmer) e no período fonatório (jitter). Para fins de comparação, geraram-se vogais com níveis conhecidos da relação sinal/ruído. Em seguida, para cada caso mediu-se a relação sinal/ruído utilizando a S2NR e um algoritmo baseado na demarcação da periodicidade da vogal. A S2NR mostrou-se, na maioria das situações com voz sintética, mais robusta a perturbações de jitter e de shimmer e com menor sensibilidade à vogal. Foram testadas freqüências fundamentais masculinas e femininas com tratos vocais para as vogais /a/, /i/ e /u/. O teste inicialmente foi feito variando, de forma independente, o nível de jitter e de shimmer desde a condição de inexistência até valores extremos (0% a 3% para jitter e 0% a 30% para shimmer). Sob jitter, com Fo = 120 Hz , os valores de desvio máximo em relação à referência foram de 2, 1 dB, 11, 5 dB e 2, 9 dB para as vogais /a/, /i/ e /u/, respectivamente. Já sob shimmer, estes valores foram de 2, 5 dB, 4, 4 dB e 3, 6 dB. Em seguida, aplicaram-se as perturbações simultaneamente, não ocorrendo perdas de desempenho diferentes das observadas com perturbações individuais. Finalmente, o algoritmo S2NR foi testado com vozes reais disfônicas predominantemente soprosas, resultando numa relação consistente com a classificação perceptiva de soprosidade. Em adição a estes testes, mostrou-se a utilização do algoritmo S2NR em fala encadeada.

ASSUNTO(S)

engenharia elétrica teses.

Documentos Relacionados