Estudo de desempenho de algoritmos de aprendizagem sob condiÃÃes de ambigÃidade sensorial.

Monteiro, Sildomar Takahashi

Algoritmos de aprendizagem autÃnoma tÃm sido propostos para lidar com a questÃo de como um agente autÃnomo pode aprender a realizar uma tarefa simples apenas interagindo com o seu ambiente. Existem muitos trabalhos apresentando resultados significativos, porÃm, apenas em simulaÃÃo, o que freqÃentemente leva a crÃticas desfavorÃveis a respeito da validade dos resultados obtidos. Aspectos inerentes ao mundo real sÃo ignorados, dificultando a anÃlise dos algoritmos sob condiÃÃes suscetÃveis ao problema. A proposta desta dissertaÃÃo Ã analisar a sensibilidade de tais algoritmos a situaÃÃes de ambigÃidade de estados comumente produzidas pela baixa capacidade sensorial de robÃs mÃveis. Tal sensibilidade Ã produzida pela quebra de uma condiÃÃo teÃrica (condiÃÃo de Markov) importante para garantia de convergÃncia de tais algoritmos, mas as conseqÃÃncias prÃticas desta violaÃÃo sobre sistemas reais nÃo estÃo bem estabelecidas na literatura. Os algoritmos de aprendizagem alvos deste estudo foram: Q-learning, Sarsa e Peng-Williams. As experiÃncias foram realizadas em simulaÃÃo e em sistemas reais utilizando dois robÃs: o mini-robÃ Khepera e o robÃ Magellan. Durante os experimentos com o Magellan, implementou-se um mÃtodo para gerar mapas cognitivos do ambiente com resoluÃÃo variÃvel, de modo a produzir um verificador de desempenho dos algoritmos de aprendizagem. Verificou-se que os algoritmos de aprendizagem implementados apresentaram desempenho satisfatÃrio nos sistemas reais, apesar de perder um pouco a sua eficiÃncia devido Ã ambigÃidade dos estados, proveniente de caracterÃsticas inerentes ao mundo real ou introduzida artificialmente. O algoritmo Q-learning obteve o melhor desempenho geral durante os experimentos, seguido pelo Sarsa. O algoritmo Peng-Williams teve seu desempenho prejudicado pelos parÃmetros da experiÃncia. O mÃtodo para aprendizagem de mapas cognitivos mostrou-se eficiente e permitiu avaliaÃÃo adequada dos algoritmos.

Estudo de desempenho de algoritmos de aprendizagem sob condiÃÃes de ambigÃidade sensorial.

AUTOR(ES)

DATA DE PUBLICAÇÃO

RESUMO

ASSUNTO(S)

ACESSO AO ARTIGO

Documentos Relacionados