2003-12

Controle ótimo de descarregadores de navios utilizando aprendizado por reforço

Este trabalho descreve o uso de Aprendizado por Reforço para a obtenção de trajetórias ótimas e controle anti-balanço de um descarregador de navios. O ciclo de descarga é dividido em seis etapas e, para cada uma delas, é definido um problema de otimização. Para a solução deste são utilizados um algoritmo TD(0) juntamente com uma rede neural do tipo perceptron multicamada como um aproximador da função valor. Os resultados obtidos são comparados com resultados de Controle Ótimo.

Texto completo
  • Assuntos:

    • Aprendizado por Reforço
    • Controle Ótimo
    • Controle Anti-Balanço
    • Descarregadores de Navios
    • Redes Neurais