ConversÃo fala-texto em portuguÃs do Brasil integrando segmentaÃÃo sub-silÃbica e vocabulÃrio ilimitado.

AUTOR(ES)
DATA DE PUBLICAÇÃO

1998

RESUMO

Desenvolvemos e implementamos um sistem fala-texto com vocabulÃrio ilimitado para o portuguÃs do Brasil. A primeira parte do sistema, denominada reconhecedor fonÃtico, à capaz de segmentar e reconhecer a fala contÃnua formada por sÃlabas com estrutura CV, V, VC e CVC, que perfazem 90% de freqÃÃncia em portuguÃs. A segmentaÃÃo sub-silÃbica à realizada por um algoritmo que integra de forma original a tÃcnica dos Modelos Ocultos de Markov (HMM) com regras extraÃdas da prÃpria estrutura fonÃtica do portuguÃs brasileiro. O algoritmo divide a fala contÃnua em unidades sub-silÃbicas e o reconhecimento fonÃtico destas unidades à feito com uso de HMM contÃnuos, cujos vetores de observaÃÃo sÃo formados basicamente por coeficientes Mel-cepstrais. A segunda parte denominada gerador de texto, consiste principalmente num conversor fonolÃgico-grafÃmico desenvolvido especificamente para a lÃngua portuguesa falada no Brasil. Esta parte do sistema consegue converter qualquer seqÃÃncia fonÃmica nos correspondentes grafemas, eliminando as possibilidades ortograficamente incorretas. O desempenho do sistema como um todo foi avaliado com base no texto final gerado a partir de 200 frases pronunciadas em taxa de elocuÃÃo lenta por um Ãnico locutor, para o qual os modelos de Markov foram treinados. Obtivemos uma taxa de reconhecimento de 95,9% para todos os fonemas da lÃngua portuguesa, excetuando as semivogais. Para os mesmos dados, o erro de segmentaÃÃo silÃbica mÃximo foi de 0,83% e o Ãndice para o reconhecimento de palavras, de um vocabulÃrio ilimitado, foi de 87%. Considerando-se atà a quinta palavra mais provÃvel, a taxa de acerto das mesmas sobe para 96,2% e a de fonemas para 99%, enquanto que o erro de segmentaÃÃo cai para 0,52%.

ASSUNTO(S)

fonÃtica reconhecimento de voz fala processamento de sinais sistemas digitais algoritmos lÃngua portuguesa

Documentos Relacionados