Um estudo sobre limitações de técnicas de mascaramento espectral na separação cega de sinais de voz reverberados
AUTOR(ES)
Gustavo Fernandes Rodrigues
FONTE
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia
DATA DE PUBLICAÇÃO
30/05/2008
RESUMO
O objetivo deste trabalho é analisar e verificar as limitações de técnicas de mascaramento binário no domínio tempo-freqüência para o problema de separação cega de fontes (Blind Source Separation) a partir de misturas convoluídas. Tais técnicas baseiam-se na esparsidade dos sinais de voz e consideram que, em uma mistura de fontes independentes, é improvável encontrar sinais ativos em um mesmo instante de tempo e freqüência. Neste trabalho, inicialmente, é verificado o desempenho do algoritmo DUET para misturas convoluídas. A utilização da informação de fase para a separação de fontes é avaliada através da análise de desempenho de um algoritmo proposto que considera apenas a informação de amplitude relativa para a estimação das máscaras espectrais. Observa-se que, no caso específico da separação de dois sinais de voz, a utilização da informação de fase não influi no desempenho do algoritmo. No próximo passo, analisa-se as limitações da técnica de mascaramento espectral em função do tempo de reverberação dos sinais que formam a mistura a ser separada. Quando se conhece as máscaras ideais, obtém-se uma separação da ordem de 9 dB, para o caso de um ambiente com tempo de reverberação inferior a 300 ms. A partir daí, à medida que o tempo de reverberação aumenta, os sinais que formam as misturas analisadas espalham-se sobre o plano tempo-frequência, reduzindo progressivamente o desempenho do processo de separação. A seguir, dado que encontrar máscaras ideais com base em apenas uma mistura é ainda um problema em aberto, mede-se a queda de desempenho do processo de separação em função da distância entre a máscara ideal e a máscara efetivamente usada. Os resultados encontrados indicam uma queda de desempenho de 3 dB quando aproximadamente 10% dos bits da máscara ideal estão invertidos. Finalmente, são realizadas análises preliminares para encontrar a máscara ideal com base na negentropia, na curtose e na energia dos sinais separados.
ASSUNTO(S)
ACESSO AO ARTIGO
http://hdl.handle.net/1843/BUOS-8CVHTGDocumentos Relacionados
- Separação cega de sinais em sistemas ópticos com multiplexação de polarização
- Sobre separação cega de fontes : proposições e analise de estrategias para processamento multi-usuario
- Um estudo sobre separação cega de fontes e contribuições ao caso de misturas não-lineares
- Voz e fala de Parkinsonianos durante situações de amplificação, atraso e mascaramento
- Contribuições ao problema de separação cega de fontes, com ênfase no estudo de sinais esparsos