Sistema baseado em regras para o refinamento da segmentação automatica de fala / Rule based system for refining the automatic speech segmentation
AUTOR(ES)
Antonio Marcos Selmini
DATA DE PUBLICAÇÃO
2008
RESUMO
A demanda por uma segmentação automática de fala confiável vem crescendo e exigindo pesquisas para suportar o desenvolvimento de sistemas que usam fala para uma interação homem-máquina. Neste contexto, este trabalho relata o desenvolvimento e avaliação de um sistema para segmentação automática de fala usando o algoritmo de Viterbi e refinamento das fronteiras de segmentação baseado nas características fonético-acústicas das classes fonéticas. As subunidades fonéticas (dependentes de contexto) são representadas com Modelos Ocultos de Markov (HMM - Hidden Markov Models). Cada fronteira estimada pelo algoritmo de Viterbi é refinada usando características acústicas dependentes de classes de fones, uma vez que a identidade dos fones do lado direito e esquerdo da fronteira considerada é conhecida. O sistema proposto foi avaliado usando duas bases dependentes de locutor do Português do Brasil (uma masculina e outra feminina) e também uma base independente de locutor (TIMIT). A avaliação foi realizada comparando a segmentação automática com a segmentação manual. Depois do processo de refinamento, um ganho de 29% nas fronteiras com erro de segmentação abaixo de 20 ms foi obtido para a base de fala dependente de locutor masculino do Português Brasileiro
ASSUNTO(S)
automatic speech segmentation fonetica acustica processo de acoustic-phonetic features markov reconhecimento automatico da voz refining the automatic speech segmentation sistemas de processamento da fala viterbi s algorithm hmm modelling
ACESSO AO ARTIGO
http://libdigi.unicamp.br/document/?code=000433164Documentos Relacionados
- Sistema para SeleÃÃo AutomÃtica de Grupos de Ajustes em RelÃs de ProteÃÃo
- Aprimorando o tratamento de expressões multipalavras em um tradutor automatico baseado em regras
- HIBRID NEURO-FUZZY-GENETIC SYSTEM FOR AUTOMATIC DATA MINING
- Construção semi-automática de taxonomias para generalização de regras de associação
- Segmentação de voz baseada na análise fractal e na transformada wavelet.