Estratégias baseadas em aprendizado para coordenação de uma frota de robôs em tarefas cooperativas

Dennis Barrios Aranibar

Em sistemas multi-robôs a arquitetura de controle e a estratégia de trabalho representam um desafio para os pesquisadores. É importante que a arquitetura de controle seja robusta, de forma que se adapte naturalmente às mudanças nas características do problema e também que a estratégia de trabalho permita aos robôs desenvolver as tarefas atribuídas eficaz e eficientemente, levando em consideração a restrição de que os robôs vão interagir diretamente em ambientes povoados de seres humanos. Neste contexto, este trabalho explora duas abordagens para a coordenação de uma frota de robôs desenvolvendo tarefas cooperativas. Ambas as abordagens são baseadas em uma mistura de aprendizado por imitação e por experiência. Assim, na primeira abordagem desenvolveu-se uma arquitetura de controle, uma máquina de inferência difusa para reconhecimento de fatos em jogos de futebol, um software narrador de jogos baseado na máquina de inferência difusa, e a implementação de aprendizado por imitação a partir de observação e análise de outros times robóticos. Além disso, aplicou-se eficientemente abstração de estados em aprendizado por reforço no problema padrão de futebol de robôs. Finalmente, o aprendizado por reforço foi implementado de forma que as ações somente são executadas em certos estados (por exemplo os estados onde algum sistema robótico especialista já as utilizou) diferentemente da forma tradicional onde as ações no banco de conhecimento têm que ser testadas em todos os estados. No caso da segunda abordagem, implementou-se aprendizado por reforço com aproximação de funções, para o que foi criado um algoritmo chamado RBF-Sarsa($lambda$). Em ambas as abordagens implementou-se o aprendizado por reforço em lotes e o aprendizado por imitação como semente para aprendizado por reforço. Além disso, explorou-se o aprendizado com times de robôs controlados por seres humanos. As propostas deste trabalho mostraram-se eficientes no problema padrão de futebol de robôs, e ao serem implementadas em outros sistemas robóticos permitirão que os mesmos sejam eficazes e eficientes no desenvolvimento das tarefas atribuídas com um alto grau de adaptação às mudanças dos requerimentos e do ambiente.

Estratégias baseadas em aprendizado para coordenação de uma frota de robôs em tarefas cooperativas

AUTOR(ES)

DATA DE PUBLICAÇÃO

RESUMO

ASSUNTO(S)

ACESSO AO ARTIGO

Documentos Relacionados