Um estudo sobre limitações de técnicas de mascaramento espectral na separação cega de sinais de voz reverberados

Gustavo Fernandes Rodrigues

O objetivo deste trabalho é analisar e verificar as limitações de técnicas de mascaramento binário no domínio tempo-freqüência para o problema de separação cega de fontes (Blind Source Separation) a partir de misturas convoluídas. Tais técnicas baseiam-se na esparsidade dos sinais de voz e consideram que, em uma mistura de fontes independentes, é improvável encontrar sinais ativos em um mesmo instante de tempo e freqüência. Neste trabalho, inicialmente, é verificado o desempenho do algoritmo DUET para misturas convoluídas. A utilização da informação de fase para a separação de fontes é avaliada através da análise de desempenho de um algoritmo proposto que considera apenas a informação de amplitude relativa para a estimação das máscaras espectrais. Observa-se que, no caso específico da separação de dois sinais de voz, a utilização da informação de fase não influi no desempenho do algoritmo. No próximo passo, analisa-se as limitações da técnica de mascaramento espectral em função do tempo de reverberação dos sinais que formam a mistura a ser separada. Quando se conhece as máscaras ideais, obtém-se uma separação da ordem de 9 dB, para o caso de um ambiente com tempo de reverberação inferior a 300 ms. A partir daí, à medida que o tempo de reverberação aumenta, os sinais que formam as misturas analisadas espalham-se sobre o plano tempo-frequência, reduzindo progressivamente o desempenho do processo de separação. A seguir, dado que encontrar máscaras ideais com base em apenas uma mistura é ainda um problema em aberto, mede-se a queda de desempenho do processo de separação em função da distância entre a máscara ideal e a máscara efetivamente usada. Os resultados encontrados indicam uma queda de desempenho de 3 dB quando aproximadamente 10% dos bits da máscara ideal estão invertidos. Finalmente, são realizadas análises preliminares para encontrar a máscara ideal com base na negentropia, na curtose e na energia dos sinais separados.

Um estudo sobre limitações de técnicas de mascaramento espectral na separação cega de sinais de voz reverberados

AUTOR(ES)

FONTE

DATA DE PUBLICAÇÃO

RESUMO

ASSUNTO(S)

ACESSO AO ARTIGO

Documentos Relacionados