Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes

AUTOR(ES)
DATA DE PUBLICAÇÃO

2009

RESUMO

Este trabalho tem por objetivo o estudo, implementação e avaliação de técnicas de compressão de voz, baseadas na detecção de períodos de silêncio, aplicadas a redes de pacotes. Para tanto, foram estudados os conceitos fundamentais de processamento digital de sinais, incluindo aplicações e modelos matemáticos. Posteriormente, estudou-se a estrutura dos sistemas de transmissão de sinais de voz via redes de pacotes, em essência, sistemas de Voz sobre IP (VoIP). Nestes sistemas, foram vistas a aplicabilidade e princípios de funcionamento dos componentes de DSP, desde a própria compressão da voz, baseada nos períodos de silêncio, bem como padrões de codificação, cancelamento de eco, controle automático de ganho e geração de ruído de conforto. Posteriormente é proposta então a implementação de seis técnicas de compressão de voz baseadas na combinação de diferentes algoritmos aplicados na detecção de períodos de silêncio ou não da fala. Dentre os algoritmos aplicados, está a análise no tempo e em frequência do conteúdo de energia do sinal de voz, a análise do sinal na busca dos sons fricativos da fala, e ainda aplicação de recobrimento e compensação por ruído de conforto. Para a implementação das técnicas foram desenvolvidas ferramentas computacionais de testes, e para fins de validação e comparação dos resultados foram utilizadas, com as devidas adaptações, e descritas no trabalho, as recomendações P.800 (MOS) e P.862 (PESQ) do ITU-T, sendo estas entre as mais reconhecidas em termos de avaliação da qualidade do sinal de áudio percebido em sistemas de telecomunicações. Por fim, são apresentados os resultados e as conclusões, onde nos mesmos buscava-se um compromisso das implementações entre percentual estimado de economia de banda proporcionada a redes de pacotes, e nível de degradação do sinal de voz proporcionado pela aplicação da compressão, ao mesmo tempo em que sem comprometimento com alta demanda computacional do sistema. Neste sentido, se verificou que em termos de economia de banda proporcionada e qualidade do áudio, as técnicas LSED, SFD e CVAD, todas implementadas no domínio frequência, apresentaram resultados bastante satisfatórios, assim como a LED e ALED, implementadas no domínio do tempo, que também não ficaram muito atrás em termos de resultados gerais. Também ficou claro o efeito da aplicação do recobrimento e da compensação por ruído de conforto amostrado do próprio microfone do locutor. Por fim, sugere-se um número de possibilidades para a continuidade do trabalho, bem como evolução dos mesmos, tanto em termos de melhorias quanto na diversificação das aplicações dos resultados.

ASSUNTO(S)

algoritmos compressÃo engenharia elÉtrica transmissÃo de sinais processamento de sinais - tÉcnicas digitais engenharias

Documentos Relacionados