Digital Speech Processing
Mostrando 1-12 de 12 artigos, teses e dissertações.
-
1. Percepção de fala dos deficientes auditivos usando aparelho de amplificação com algoritmo de redução de ruído
Frequentemente, os indivíduos com perda auditiva têm dificuldade de entender a fala no ambiente ruidoso. OBJETIVO: O objetivo deste estudo foi avaliar clinicamente o desempenho dos indivíduos adultos com deficiência auditiva neurossensorial, com relação à percepção da fala, utilizando o aparelho de amplificação sonora individual digital com o algo
Brazilian Journal of Otorhinolaryngology. Publicado em: 2010-02
-
2. Identificação de locutor usando modelos de misturas de gaussianas. / Speaker identification using Gaussian mixture models.
A identificação de locutor está relacionada com a seleção de um locutor dentro de um conjunto de membros pré-definidos e neste trabalho os experimentos foram realizados utilizando um sistema de identificação de locutor independente de texto baseado em modelos de mistura de gaussianas. Para realizar os testes, foi empregado o banco de voz TIMIT e sua
Publicado em: 2009
-
3. Segmentação de voz baseada na análise fractal e na transformada wavelet. / Speech segmentation based on fractal analysis and wavelet transform.
Nowadays, fractal analysis has been successfully applied to digital speech processing, particularly for words and phonemes segmentation, which represents one of the fundamental steps in automatic speech recognition and speaker identification systems. The practical use of fractal analysis for these purposes should match two principles: low computational cost,
Publicado em: 2008
-
4. Dynamic Time Warping baseado na transformada wavelet / Dynamic Time Warping based-on wavelet transform
Dynamic Time Warping (DTW) é uma técnica do tipo pattern matching para reconhecimento de padrões de voz, sendo baseada no alinhamento temporal de um sinal com os diversos modelos de referência. Uma desvantagem da DTW é o seu alto custo computacional. Este trabalho apresenta uma versão da DTW que, utilizando a Transformada Wavelet Discreta (DWT), reduz
Publicado em: 2007
-
5. CLASSIFICAÇÃO E SEGMENTAÇÃO DE ÁUDIO A PARTIR DE FATORES DE ESCALA MPEG / CLASSIFICATION AND SEGMENTATION OF MPEG AUDIO BASED ON SCALE FACTORS
With the growth of production and storing of digital media, audio segmentation and classification are becoming increasingly important. This work is based on characteristics of the MPEG standard, considered to be the standard for digital media storage and retrieval, to propose efficient algorithms to perform these tasks. While there are many studies based on
Publicado em: 2007
-
6. Redução de ruído em sinais de voz usando curvas especializadas de modificação dos coeficientes da transformada em co-seno. / Speech denoising by softsoft thresholding.
Many noise-reduction methods are based on the possibility of representing the clean signal as a reduced number of coefficients of a block transform, so that cancelling coefficients below a certain thresholding level will produce an enhanced reconstructed signal. It is necessary to assume that the clean signal has a sparse representation, while the noise ener
Publicado em: 2006
-
7. INTERPOLAÇÃO MODIFICADA DE LSFNULLS / MODIFIED INTERPOLATION OF LSFNULLS
Os novos serviços de telecomunicações têm impulsionado o desenvolvimento de melhorias nos algoritmos de codificação de voz, devido à necessidade de se melhorar a qualidade da voz codificada, utilizando a menor taxa de transmissão possível. Esta dissertação analisa e propõem melhorias em um método para o ajuste de parâmetros LSFs de modo a torn�
Publicado em: 2006
-
8. Algoritmos OPWI e LDM-GA para sistemas de conversão texto-fala de alta qualidade empregando a tecnologia SCAUS / Algorithm OPWI and LDM-GA for high quality text-to-speech synthesis based on automatic unit selection
This Thesis presents two new algorithms for Unit Selection Based Text-to-Speech systems (USBTTS). The first algorithm is the OPWI (Optimized Prototype Waveform Interpolation), which was designed to be used as a Back-End module for USB-TTS. The second algorithm is the LDM-GA (Linguistic Data Mining Using Genetic AIgorithm), which was designed to minimize trai
Publicado em: 2006
-
9. VOZ EM JOGO - O SOM DA IMAGEM: ANÁLISE VISUAL DE JOGOS COMPUTACIONAIS PARA O DESENVOLVIMENTO FONOARTICULATÓRIO DE CRIANÇAS SURDAS / PLAYING FOR SPEECH - THE SOUND OF IMAGES: VISUAL ANALYSIS OF COMPUTATIONAL GAMES FOR EXERCISING ARTICULATORY COORDINATION IN DEAF CHILDREN
This thesis begins with a study at the Instituto Nacional de Educação dos Surdos (Brazilian Institute of Deaf Education) examining the visual messages of computer-based game of speech training for deaf children. The game, known as Jogos de Voz, developed by DS Antonio Marcos de Lima Araújo, as his thesis at the Laboratory of Digital Processing Speech, of
Publicado em: 2004
-
10. Melhoria da qualidade de sinais de fala degradados por ruído através da utilização de sinais sintetizados. / Speech Enhancement using synthetized signals.
Este trabalho discute um novo método para a melhoria da qualidade de sinais de fala degradados por ruído aditivo branco de elevada intensidade (SNR segmentada variando de 10 a 3 dB). A técnica apresentada baseia-se na soma ponderada entre um sinal obtido por subtração espectral e um sinal sintetizado, produzido de acordo com o modelo digital de produç�
Publicado em: 2003
-
11. Research in speech communication.
Advances in digital speech processing are now supporting application and deployment of a variety of speech technologies for human/machine communication. In fact, new businesses are rapidly forming about these technologies. But these capabilities are of little use unless society can afford them. Happily, explosive advances in microelectronics over the past tw
-
12. What does voice-processing technology support today?
This paper describes the state of the art in applications of voice-processing technologies. In the first part, technologies concerning the implementation of speech recognition and synthesis algorithms are described. Hardware technologies such as microprocessors and DSPs (digital signal processors) are discussed. Software development environment, which is a k