Codificador G729a orientado à avaliação da qualidade perceptual do sinal de voz
AUTOR(ES)
Flávio Luis Wisnevski
FONTE
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia
DATA DE PUBLICAÇÃO
25/08/2011
RESUMO
Esta dissertação apresenta um modelo de codificador da voz que avalia a qualidade perceptual, utilizando-se um codificador paramétrico definido pela Recomendação do ITU-T, o G729a , conhecido tecnicamente como Conjugate Structure Algebraic Code Excited Linear Prediction (CS-ACELP). Atualmente, a codificação de voz é avaliada por parâmetros subjetivos, em que não há uma análise para melhoria perceptual que altere os parâmetros dinamicamente. O objetivo deste trabalho é a melhoria no desempenho do sinal codificado na fonte, considerando as limitações de trabalhar com as variáveis escalares do codec. Foi realizada uma análise sobre os sinais de voz para dar subsídios ao leitor, possibilitando o entendimento teórico e uma descrição sobre o codificador G729a, enfatizando os estágios de codificação dos parâmetros escalares, objeto deste estudo.Programou-se no codificador G729a, o algoritmo PESQ, o qual realiza a análise perceptual do sinal de voz. Também foi avaliada recomendação P.862 do ITU-T que descreve o algoritmo de avaliação da qualidade perceptual. Para validar a metodologia proposta, foram realizados experimentos em sinais de voz do banco de dados Timit, em que se estudou o comportamento do sinal de voz e a melhoria perceptual devido à alteração dos parâmetros escalares de codificação do sinal. No experimento realizado, foi realizada a modificação no codificador CS-ACELP com a utilização de uma análise perceptual ponderando a avaliação do algoritmo do PESQ para decisão de atuação sobre a codificação, o que resultou em sinais de maior qualidade para os usuários, garantindo a estabilidade de 72,41% e melhorando 50,38% dos quadros avaliados pelo PESQ. Houve alteração no ganho de pitch, sem a modificação da essência do codec.
ASSUNTO(S)
engenharia elÉtrica processamento de sinais engenharia eletrica decodificadores processamento de voz algoritmos telecomunicaÇÕes
ACESSO AO ARTIGO
http://tede.pucrs.br/tde_busca/arquivo.php?codArquivo=3763Documentos Relacionados
- Medição de Qualidade de voz em Wireless utilizando os codecs G711,G729,G723 e GSM
- Melhoria do codificador de fala G.722.1 atraves do uso de um modelo perceptual
- Qualidade de vida em voz, avaliação perceptivoauditiva e análise acústica da voz de professoras com queixas vocais
- Avaliação objetiva de qualidade de sinais de audio e voz
- Qualidade de Vida em Voz na População Pediátrica: validação da versão brasileira do Protocolo Qualidade de Vida em Voz Pediátrico