Estudo de desempenho de algoritmos de aprendizagem sob condiÃÃes de ambigÃidade sensorial.
AUTOR(ES)
Monteiro, Sildomar Takahashi
DATA DE PUBLICAÇÃO
2002
RESUMO
Algoritmos de aprendizagem autÃnoma tÃm sido propostos para lidar com a questÃo de como um agente autÃnomo pode aprender a realizar uma tarefa simples apenas interagindo com o seu ambiente. Existem muitos trabalhos apresentando resultados significativos, porÃm, apenas em simulaÃÃo, o que freqÃentemente leva a crÃticas desfavorÃveis a respeito da validade dos resultados obtidos. Aspectos inerentes ao mundo real sÃo ignorados, dificultando a anÃlise dos algoritmos sob condiÃÃes suscetÃveis ao problema. A proposta desta dissertaÃÃo à analisar a sensibilidade de tais algoritmos a situaÃÃes de ambigÃidade de estados comumente produzidas pela baixa capacidade sensorial de robÃs mÃveis. Tal sensibilidade à produzida pela quebra de uma condiÃÃo teÃrica (condiÃÃo de Markov) importante para garantia de convergÃncia de tais algoritmos, mas as conseqÃÃncias prÃticas desta violaÃÃo sobre sistemas reais nÃo estÃo bem estabelecidas na literatura. Os algoritmos de aprendizagem alvos deste estudo foram: Q-learning, Sarsa e Peng-Williams. As experiÃncias foram realizadas em simulaÃÃo e em sistemas reais utilizando dois robÃs: o mini-robà Khepera e o robà Magellan. Durante os experimentos com o Magellan, implementou-se um mÃtodo para gerar mapas cognitivos do ambiente com resoluÃÃo variÃvel, de modo a produzir um verificador de desempenho dos algoritmos de aprendizagem. Verificou-se que os algoritmos de aprendizagem implementados apresentaram desempenho satisfatÃrio nos sistemas reais, apesar de perder um pouco a sua eficiÃncia devido à ambigÃidade dos estados, proveniente de caracterÃsticas inerentes ao mundo real ou introduzida artificialmente. O algoritmo Q-learning obteve o melhor desempenho geral durante os experimentos, seguido pelo Sarsa. O algoritmo Peng-Williams teve seu desempenho prejudicado pelos parÃmetros da experiÃncia. O mÃtodo para aprendizagem de mapas cognitivos mostrou-se eficiente e permitiu avaliaÃÃo adequada dos algoritmos.
ASSUNTO(S)
redes neurais avaliaÃÃo de desempenho robÃs inteligÃncia artificial aprendizagem algoritmos cinemÃtica
ACESSO AO ARTIGO
http://www.bd.bibl.ita.br/tde_busca/arquivo.php?codArquivo=150Documentos Relacionados
- Hidrogeno tartarato de potÃssio sob condiÃÃes extremas.
- Estudo e modelagem sob condiÃÃes de fluÃncia da liga Ti6Al4V.
- Vieses cognitivos nas decisÃes de investimentos: uma anÃlise do excesso de confianÃa, aversÃo à ambigÃidade e efeito disposiÃÃo sob a perspectiva das finanÃas comportamentais
- ProduÃÃo de B-Galactosidase e biomassa por kluyveromyces marxianus sob diferentes condiÃÃes de cultivo
- A ambigÃidade no princÃpio da complementaridade entre os sistemas de radiodifusÃo na CF: inoperÃncia regulatÃria, crise do Estado e domÃnio privado