Automatic Speech Recognition
Mostrando 1-12 de 22 artigos, teses e dissertações.
-
1. Digital version of the Rapid Automatized Naming (RAN): a contribution to early detection of reading problems in children
RESUMO Objetivo: apresentar uma versão digital do teste de Nomeação Automática Rápida (RAN), construído para ser uma ferramenta auxiliar para detectar precocemente problemas de leitura em crianças. Métodos: o aplicativo foi elaborado visando fornecer recursos, como: a) cadastro de indivíduos; b) segurança da informação com o uso do sistema de a
Rev. CEFAC. Publicado em: 08/04/2019
-
2. Uso de parâmetros multifractais no reconhecimento de locutor / Use of multifractal parameters for speaker recognition
Esta dissertação apresenta a implementação de um sistema de Reconhecimento Automático de Locutor (ASR). Este sistema emprega um novo parâmetro de características de locutor baseado no modelo multifractal "VVGM" (Variable Variance Gaussian Multiplier). A metodologia adotada para o desenvolvimento deste sistema foi formulada em duas etapas. Inicialmente
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 30/09/2011
-
3. Transcrição em tempo real de textos utilizando um dicionário fonético
In the quest to develop a technique which facilitates the process of automatic speech recognition for transcription real-time text using a phonetic dictionary, this work adopts a proposal nicknamed brazilês plus the use of syllables in the transcription process seeking possible imporvements to the automation especially in systems focused on accessibility, o
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 03/09/2011
-
4. Automatic speech recognition, with large vocabulary, robustness, independence of speaker and multilingual processing
Este trabalho visa prover assistência cognitiva automática via interface de fala, à idosos que moram sozinhos, em situação de risco. Expressões de angústia e comandos vocais fazem parte do vocabulário alvo de reconhecimento de fala. Durante todo o trabalho, o sistema de reconhecimento de fala contínua de grande vocabulário Julius é utilizado em co
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 27/08/2010
-
5. A novel word boundary detector based on the teager energy operator for automatic speech recognition
This work is part of a major research project and contributes into the development of a speaker-independent speech recognition system for isolated words from a limited vocabulary. It proposes a novel spoken word boundary detection method named TEO-based method for Spoken Word Segmentation (TSWS). Based on the Teager Energy Operator (TEO), the TSWS is present
Publicado em: 2010
-
6. DISTRIBUTED RECOGNITION FOR CONTINUOUS SPEECH IN LARGE VOCABULARY BRAZILIAN PORTUGUESE / RECONHECIMENTO DISTRIBUÍDO DE VOZ CONTÍNUA COM AMPLO VOCABULÁRIO PARA O PORTUGUÊS BRASILEIRO
This Thesis aims at exploring several approaches for performance improvement of the Automatic Speech Recognition System with large vocabulary for the Brazilian Portuguese when applied in a distributed scenario (Distributed Speech Recognition). With this purpose, a speech database for continuous speech recognition for the Brazilian Portuguese with 100 speaker
Publicado em: 2009
-
7. Reconhecimento de voz através de unidades menores do que a palavra, utilizando Wavelet Packet e SVM, em uma nova estrutura hierárquica de decisão
The automatic speech recognition by machine has been the target of researchers in the past five decades. In this period have been numerous advances, such as in the field of recognition of isolated words (commands), which has very high rates of recognition, currently. However, we are still far from developing a system that could have a performance similar to
Publicado em: 2008
-
8. Segmentação de voz baseada na análise fractal e na transformada wavelet. / Speech segmentation based on fractal analysis and wavelet transform.
Nowadays, fractal analysis has been successfully applied to digital speech processing, particularly for words and phonemes segmentation, which represents one of the fundamental steps in automatic speech recognition and speaker identification systems. The practical use of fractal analysis for these purposes should match two principles: low computational cost,
Publicado em: 2008
-
9. Dynamic Time Warping baseado na transformada wavelet / Dynamic Time Warping based-on wavelet transform
Dynamic Time Warping (DTW) é uma técnica do tipo pattern matching para reconhecimento de padrões de voz, sendo baseada no alinhamento temporal de um sinal com os diversos modelos de referência. Uma desvantagem da DTW é o seu alto custo computacional. Este trabalho apresenta uma versão da DTW que, utilizando a Transformada Wavelet Discreta (DWT), reduz
Publicado em: 2007
-
10. Conversion grapheme-phone for a system of recognition of voice with support the great vocabularies for the Brazilian Portuguese / Conversão grafema-fone para um sistema de reconhecimento de voz com suporte a grandes vocabulários para o português brasileiro
Speech processing has become a data-driven technology. Hence, the success of research in this area is linked to the existence of public corpora and associated resources, as a phonetic dictionary. In contrast to other languages such as English, one cannot find, in public domain, a Large Vocabulary Continuos Speech Recognition (LVCSR) System for Brazilian Port
Publicado em: 2006
-
11. Sintese e reconhecimento da fala humana / Synthesis and recognition of human speech
The goal of this dissertation is to review the main concepts relating to the synthesis, processing, and recognition of human speech by computer. These technologies have many applications, which have increased substantially in recent years after the spread of portable communication equipment (mobile phones, laptops, palmtops) and the universal access to the I
Publicado em: 2006
-
12. Avaliação da Relação entre Qualidade Perceptual da Fala e Taxa de Acerto de Sistemas de Reconhecimento de Fala em Ambientes Ruidosos
The goal of this work is to evaluate the distortion of the noisy speech signal being after enhanced by noise-reduction algorithms. This is performed by comparison of word accuracy (%) of a standardized Automatic Speech Recognition (ASR) system and objective measures of perceptual speech quality (PESQ-MOS score), obtained after applying noise-reduction method
Publicado em: 2005