CONTINUOUS SPEECH RECOGNITION WITH MFCC, SSCH AND PNCC FEATURES, WAVELET DENOISING AND NEURAL NETWORKS / RECONHECIMENTO DE VOZ CONTÍNUA COM ATRIBUTOS MFCC, SSCH E PNCC, WAVELET DENOISING E REDES NEURAIS
AUTOR(ES)
JAN KRUEGER SIQUEIRA
FONTE
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia
DATA DE PUBLICAÇÃO
02/09/2011
RESUMO
Um dos maiores desafios na área de reconhecimento de voz contínua é desenvolver sistemas robustos ao ruído aditivo. Para isso, este trabalho analisa e testa três técnicas. A primeira delas é a extração de atributos do sinal de voz usando os métodos MFCC, SSCH e PNCC. A segunda é a remoção de ruído do sinal de voz via wavelet denoising. A terceira e última é uma proposta original batizada de feature denoising, que busca melhorar os atributos extraídos usando um conjunto de redes neurais. Embora algumas dessas técnicas já sejam conhecidas na literatura, a combinação entre elas trouxe vários resultados interessantes e inéditos. Inclusive, nota-se que o melhor desempenho vem da união de PNCC com feature denoising.
ASSUNTO(S)
ruido noise reconhecimento de voz speech recognition rede neural neural network
ACESSO AO ARTIGO
Documentos Relacionados
- Reconhecimento de faces usando redes neurais e biometria
- Reconhecimento de faces usando redes neurais e biometria
- HANDWRITTEN DIGITS RECOGNITION BY NEURAL NETWORKS
- Reconhecimento automático do locutor com redes neurais pulsadas.
- Identificação de Sinais Radar Pulsados por Meio de Transformada de Wavelet Contínua e Redes Neurais Artificiais