Método de diferenças temporais aplicado às equações de Riccati acopladas entre si

Costa, Oswaldo L. V., Aya, Julio C.C.

Método de diferenças temporais aplicado às equações de Riccati acopladas entre si

AUTOR(ES)

Costa, Oswaldo L. V., Aya, Julio C.C.

FONTE

Sba: Controle & Automação Sociedade Brasileira de Automatica

DATA DE PUBLICAÇÃO

2003-09

RESUMO

Neste trabalho apresentaremos uma técnica iterativa baseada em simulações de Monte Carlo para calcular o controle ótimo de um problema de regulador linear quadrático de horizonte infinito para um sistema linear com saltos Markovianos a tempo discreto, quando a matriz de transição de probabilidade não é conhecida. Sabemos que o controle ótimo deste problema é dado em termos da solução maximal de um conjunto de equações algébricas de Riccati acopladas entre si (EARA) a tempo discreto, que foram extensivamente estudadas nos últimos anos. Traçaremos um paralelo com a teoria do algoritmo TD(lambda) para Processos Markovianos de Decisão (PMD) para desenvolver o algoritmo TD(lambda) para o controle ótimo associado à solução maximal de uma EARA.

ASSUNTO(S)

simulações de monte carlo equações algébricas de riccati acopladas entre si sistemas com saltos controle ótimo