Viewing 2 posts - 1 through 2 (of 2 total)
  • Author
    Posts
  • #40012
    Tiago Davi
    Participant

      Fiquei em dúvida com o conjunto de ações no primeiro problema, porque se tem um grid onde o robô pode se mover, ele deveria ter as ações up, down, left, right. 4 ações e não 11.

      Por que ele tem 11 ações?

      #40025
      Denny Ceccon
      Moderator

        Olá Tiago,

        O professor explica isso nas aulas das Partes 3 e 4. Neste problema, as ações não são os passos unitários do robô, mas sim seu destino final. Ou seja, se ele escolher a ação 4, isso implica ir da onde ele estiver até o estado 4. A questão dos passos unitários é tratada na tabela de recompensas, que impede que o robô escolha estados inacessíveis.

      Viewing 2 posts - 1 through 2 (of 2 total)
      • You must be logged in to reply to this topic.