APRENDIZAGEM POR REFORÇO E PROGRAMACÃO DINÂMICA ADAPTATIVA PARA PROJETO E AVALIAÇÃO DO DESEMPENHO DE ALGORITMOS DLQR EM SISTEMAS MIMO / LEARNING BY STRENGTHENING AND ADAPTIVE DYNAMIC PROGRAMMING FOR DESIGN AND EVALUATION OF PERFORMANCE DLQR ALGORITHMS IN MIMO SYSTEMS
AUTOR(ES)
Leandro Rocha Lopes
DATA DE PUBLICAÇÃO
2011
RESUMO
Em decorrência do crescente desenvolvimento tecnológico e das consequentes aplicações industriais, técnicas de controle de alto desempenho e aprendizado por reforço estão sendo desenvolvidas não só para solucionar novos problemas, mas também para melhorar o desempenho de controladores já implementados em sistemas do mundo real. As abordagens do aprendizado por reforço e do regulador linear quadrático discreto (DLQR) são conectadas pelos métodos de programação dinâmica adaptativa. Esta união é orientada para o projeto de controladores ótimos em sistemas multivariáveis (MIMO). O método proposto para sintonia de controladores DLQR fornece diretrizes para construção de heurísticas polarizadas que são aplicadas na seleção das matrizes de ponderação da recompensa instantânea. Investiga-se o desempenho das heurísticas associadas com a sintonia de controladores lineares discretos e aspectos de convergência que estão relacionados com as variações QR nos algoritmos de programação dinâmica heurística (HDP) e Ação Dependente (ADHDP). Os algoritmos e a sintonia são avaliados pela capacidade em estabelecer a política de controle ótimo que mapeia o plano-Z em um sistema dinãmico multivariável de terceira ordem.
ASSUNTO(S)
programação dinâmica controle ótimo hdp q-function adhdp sistemas multivariáveis convergência dlqr analise de algoritmos e complexidade de computacao dynamic programming optimal control hdp q-function adhdp multivariable systems convergence dlqr
ACESSO AO ARTIGO
http://www.tedebc.ufma.br//tde_busca/arquivo.php?codArquivo=590Documentos Relacionados
- Programação dinâmica eficiente com algoritmos Cache-Oblivious
- Algoritmos de programação dinâmica usados em modelos markovianos ocultos (HMMs)
- Adaptive code and language for adaptive programming: concepts and technology.
- Mathematical programming techniques for analysis and design of biotechnological systems.
- CENTRAL PATH ALGORITHMS FOR LINEAR PROGRAMMING