Extensões multimodal e multiusuário de interface gráfica e interface de voz baseadas em tecnologias de fala e modelos de interação.

AUTOR(ES)
DATA DE PUBLICAÇÃO

2009

RESUMO

A extensão de uma interface Monomodal para Multimodal de um sistema deve ocorrer de modo que o mesmo continue apresentando um funcionamento satisfatório no processo de interação. Esta migração pode ser impulsionada quando um sistema necessita oferecer um canal alternativo de interação, como nas situações em que o usuário não pode usufruir dos movimentos dos membros superiores ou da visão, ou ainda quando não se dispõe de espaço para uma interface gráfica. Oferecer interface com uso da fala como meio de interação nesses casos, pode permitir o acesso a informações e serviços que afetam significativamente o cotidiano das pessoas. O propósito da pesquisa é identificar um modo reutilizável de estender sistemas novos ou pré-existentes com Interface Monomodal tornando-as Multimodais e Multiusuário, visando melhorar ou manter sua capacidade de interação e oferecendo maior usabilidade aos sistemas. Para tal, essa dissertação propõe um modelo de arquitetura de componentes baseado em Tecnologias de Fala e Modelos de Interação e de projeto de uma estrutura de gramática. Esses modelos foram aplicados na extensão de dois protótipos de sistema para testar sua reusabilidade. O modelo de arquitetura de componentes foi identificado e a estrutura de gramática foi concebida através do re-projeto do protótipo de sistema DomoVox: aplicativo pré-existente de automação residencial para controle dos dispositivos de um ambiente doméstico. Neste processo, sistema DomoVox teve sua Interface de Voz estendida para Interface Gráfica de modo a tornar-se Multimodal e somar capacidade Multiusuário baseada na tecnologia de voz de Reconhecimento Automático de Fala e nos modelos de interação Linguagens de Comandos e Menus . O modelo e a estrutura de gramática, foram então reutilizados na implementação do protótipo de sistema BrowserVox: navegador para visitação de sites na Internet. O sistema BrowserVox teve sua Interface Gráfica estendida para Interface de Voz de modo a tornar-se Multimodal e Multiusuário, baseada nas tecnologias de fala de Reconhecimento Automático de Fala e Síntese de Texto e nos modelos de interação Linguagens de Comandos e Hipertexto . Ao final, foram realizados testes de acurácia para o sistema DomoVox com reconhecimento de alguns conjuntos de comandos, e avaliação de usabilidade para o sistema BrowserVox. O modelo de extensão gerado durante o trabalho mostrou-se aplicável e reutilizável, inicialmente projetado para atender um sistema de conteúdo de interação estático, e atendendo ainda assim, um sistema de conteúdo dinâmico.

ASSUNTO(S)

reuso de software sistemas homem-máquina multimídia computação gráfica interfaces acesso múltiplo reconhecimento de voz

Documentos Relacionados