Valor das ações

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #40012
    Tiago Davi
    Participante

    Fiquei em dúvida com o conjunto de ações no primeiro problema, porque se tem um grid onde o robô pode se mover, ele deveria ter as ações up, down, left, right. 4 ações e não 11.

    Por que ele tem 11 ações?

    #40025
    Profile photo ofdennyDenny Ceccon
    Moderador

    Olá Tiago,

    O professor explica isso nas aulas das Partes 3 e 4. Neste problema, as ações não são os passos unitários do robô, mas sim seu destino final. Ou seja, se ele escolher a ação 4, isso implica ir da onde ele estiver até o estado 4. A questão dos passos unitários é tratada na tabela de recompensas, que impede que o robô escolha estados inacessíveis.

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Você deve fazer login para responder a este tópico.