Sistemas De Processamento Da Fala
Mostrando 1-12 de 28 artigos, teses e dissertações.
-
1. Uso de parâmetros multifractais no reconhecimento de locutor / Use of multifractal parameters for speaker recognition
Esta dissertação apresenta a implementação de um sistema de Reconhecimento Automático de Locutor (ASR). Este sistema emprega um novo parâmetro de características de locutor baseado no modelo multifractal "VVGM" (Variable Variance Gaussian Multiplier). A metodologia adotada para o desenvolvimento deste sistema foi formulada em duas etapas. Inicialmente
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 30/09/2011
-
2. AMBIENTES FAVORÁVEIS À PRODUÇÃO DOS FONEMAS FRICATIVOS /z/, // e // NO TRATAMENTO DO DESVIO FONOLÓGICO / FAVORABLE ENVIRONMENTS TO THE PRODUCTION OF THE FRICATIVE PHONEMES /z/, // AND // IN THE TREATMENT OF PHONOLOGICAL DISORDER
Este estudo objetivou verificar e comparar os efeitos da terapia fonológica em dois grupos de crianças com desvio fonológico, um utilizando palavras com contextos fonológicos favoráveis e outro utilizando os contextos pouco favoráveis e neutros, na aquisição das consoantes fricativas /z/, // e //. A amostra constituiu-se de seis sujei
Publicado em: 2011
-
3. Classificador de gestos das mãos baseado em imagens para aplicação em interfaces.
A atual interação entre homens e computadores ocorre por meio de dispositivos físicos como mouses, teclados, trackballs, entre outros. Claramente, essa forma de comunicação difere daquela com que os homens se comunicam entre si, que se baseiam na fala; em expressões faciais e corporais; em gestos das mãos, etc, não sendo, portanto, naturais. Consider
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 01/12/2010
-
4. Modelo mel-cepstral generalizado para envoltória espectral de fala / Mel-generalized cepstral model for speech spectral envelope
A análise Mel-Cepstral Generalizada (MGC) corresponde a uma abordagem para estimação de envoltória espectral de fala que unifica as análises LPC, Mel-LPC, Cepstral e Mel-Cepstral. A forma funcional do modelo MGC varia continuamente com dois parâmetros reais γ e α, possibilitando que o modelo assuma diferentes características. A flexibilidade
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 27/10/2010
-
5. Automatic speech recognition, with large vocabulary, robustness, independence of speaker and multilingual processing
Este trabalho visa prover assistência cognitiva automática via interface de fala, à idosos que moram sozinhos, em situação de risco. Expressões de angústia e comandos vocais fazem parte do vocabulário alvo de reconhecimento de fala. Durante todo o trabalho, o sistema de reconhecimento de fala contínua de grande vocabulário Julius é utilizado em co
IBICT - Instituto Brasileiro de Informação em Ciência e Tecnologia. Publicado em: 27/08/2010
-
6. Classificador de gestos das mãos baseado em imagens para aplicação em interfaces.
A atual interação entre homens e computadores ocorre por meio de dispositivos físicos como mouses, teclados, trackballs, entre outros. Claramente, essa forma de comunicação difere daquela com que os homens se comunicam entre si, que se baseiam na fala; em expressões faciais e corporais; em gestos das mãos, etc, não sendo, portanto, naturais. Consider
Publicado em: 2010
-
7. Análise qualitativa/quantitativa de algoritmos para a compressão de voz aplicados a redes de pacotes
Este trabalho tem por objetivo o estudo, implementação e avaliação de técnicas de compressão de voz, baseadas na detecção de períodos de silêncio, aplicadas a redes de pacotes. Para tanto, foram estudados os conceitos fundamentais de processamento digital de sinais, incluindo aplicações e modelos matemáticos. Posteriormente, estudou-se a estrutu
Publicado em: 2009
-
8. Sistema baseado em regras para o refinamento da segmentação automatica de fala / Rule based system for refining the automatic speech segmentation
A demanda por uma segmentação automática de fala confiável vem crescendo e exigindo pesquisas para suportar o desenvolvimento de sistemas que usam fala para uma interação homem-máquina. Neste contexto, este trabalho relata o desenvolvimento e avaliação de um sistema para segmentação automática de fala usando o algoritmo de Viterbi e refinamento d
Publicado em: 2008
-
9. COMFALA : modelo computacional do processo de compreensão da fala
Esta Tese apresenta a investigação de técnicas computacionais que permitam a simulação computacional da compreensão de frases faladas. Esta investigação é baseada em estudos neurocognitivos que descrevem o processamento do cérebro ao interpretar a audição de frases. A partir destes estudos, realiza-se a proposição do COMFALA, um modelo computac
Publicado em: 2007
-
10. UM SISTEMA DE GERAÇÃO DE EXPRESSÕES FACIAIS DINÂMICAS EM ANIMAÇÕES FACIAIS 3D COM PROCESSAMENTO DE FALA / A SYSTEM FOR GENERATING DYNAMIC FACIAL EXPRESSIONS IN 3D FACIAL ANIMATION WITH SPEECH PROCESSING
Esta tese apresenta um sistema para geração de expressões faciais dinâmicas sincronizadas com a fala em uma face realista tridimensional. Entende-se por expressões faciais dinâmicas aquelas que variam ao longo do tempo e que semanticamente estão relacionadas às emoções, à fala e a fenômenos afetivos que podem modificar o comportamento de uma face
Publicado em: 2007
-
11. Algoritmos OPWI e LDM-GA para sistemas de conversão texto-fala de alta qualidade empregando a tecnologia SCAUS / Algorithm OPWI and LDM-GA for high quality text-to-speech synthesis based on automatic unit selection
This Thesis presents two new algorithms for Unit Selection Based Text-to-Speech systems (USBTTS). The first algorithm is the OPWI (Optimized Prototype Waveform Interpolation), which was designed to be used as a Back-End module for USB-TTS. The second algorithm is the LDM-GA (Linguistic Data Mining Using Genetic AIgorithm), which was designed to minimize trai
Publicado em: 2006
-
12. Sintese e reconhecimento da fala humana / Synthesis and recognition of human speech
The goal of this dissertation is to review the main concepts relating to the synthesis, processing, and recognition of human speech by computer. These technologies have many applications, which have increased substantially in recent years after the spread of portable communication equipment (mobile phones, laptops, palmtops) and the universal access to the I
Publicado em: 2006