- This topic has 1 reply, 2 voices, and was last updated 2 years, 7 months ago by .
Viewing 2 posts - 1 through 2 (of 2 total)
Viewing 2 posts - 1 through 2 (of 2 total)
- You must be logged in to reply to this topic.
Home › Forums › Fórum Inteligência Artificial aplicada para Empresas e Negócios › Valor das ações
Fiquei em dúvida com o conjunto de ações no primeiro problema, porque se tem um grid onde o robô pode se mover, ele deveria ter as ações up, down, left, right. 4 ações e não 11.
Por que ele tem 11 ações?
Olá Tiago,
O professor explica isso nas aulas das Partes 3 e 4. Neste problema, as ações não são os passos unitários do robô, mas sim seu destino final. Ou seja, se ele escolher a ação 4, isso implica ir da onde ele estiver até o estado 4. A questão dos passos unitários é tratada na tabela de recompensas, que impede que o robô escolha estados inacessíveis.