- Este tópico contém 1 resposta, 2 vozes e foi atualizado pela última vez 1 ano, 8 meses atrás por .
Visualizando 2 posts - 1 até 2 (de 2 do total)
Visualizando 2 posts - 1 até 2 (de 2 do total)
- Você deve fazer login para responder a este tópico.
Home › Fóruns › Fórum Inteligência Artificial aplicada para Empresas e Negócios › Valor das ações
Fiquei em dúvida com o conjunto de ações no primeiro problema, porque se tem um grid onde o robô pode se mover, ele deveria ter as ações up, down, left, right. 4 ações e não 11.
Por que ele tem 11 ações?
Olá Tiago,
O professor explica isso nas aulas das Partes 3 e 4. Neste problema, as ações não são os passos unitários do robô, mas sim seu destino final. Ou seja, se ele escolher a ação 4, isso implica ir da onde ele estiver até o estado 4. A questão dos passos unitários é tratada na tabela de recompensas, que impede que o robô escolha estados inacessíveis.