Valor das ações

Visualizando 2 posts - 1 até 2 (de 2 do total)
  • Autor
    Posts
  • #40012
    Tiago Davi
    Participante

      Fiquei em dúvida com o conjunto de ações no primeiro problema, porque se tem um grid onde o robô pode se mover, ele deveria ter as ações up, down, left, right. 4 ações e não 11.

      Por que ele tem 11 ações?

      #40025
      Denny Ceccon
      Moderador

        Olá Tiago,

        O professor explica isso nas aulas das Partes 3 e 4. Neste problema, as ações não são os passos unitários do robô, mas sim seu destino final. Ou seja, se ele escolher a ação 4, isso implica ir da onde ele estiver até o estado 4. A questão dos passos unitários é tratada na tabela de recompensas, que impede que o robô escolha estados inacessíveis.

      Visualizando 2 posts - 1 até 2 (de 2 do total)
      • Você deve fazer login para responder a este tópico.