- Este tópico contém 1 resposta, 1 voz e foi atualizado pela última vez 2 meses atrás por .
Visualizando 2 posts - 1 até 2 (de 2 do total)
Visualizando 2 posts - 1 até 2 (de 2 do total)
- Você deve fazer login para responder a este tópico.
Home › Fóruns › Fórum Aprendizagem por Reforço com Augmented Random Search (ARS) › Resolver um grid / maze
Queria usar para resolver um grid, mas o sigma_r sempre fica zerado. da erro e os pesos não atualizam.
Estou achando que o problema é meu env.. eu tenho um grid de 65 x 85 que começa lá no (0,0) e tem que chegar no final (64, 84) e no meio tem bloqueios que mudam dinamicamente..
Tem alguma ideia de como possa usar isso para um env costumizado?
class BasicEnv(gym.Env):
def __init__(self, maze):
self.maze = maze
low = np.zeros(len(maze.shape), dtype=int)
high = np.array(maze.shape, dtype=int) – \
np.ones(len(maze.shape), dtype=int)
self.observation_space = gym.spaces.Box(low, high, dtype=np.int32)
self.action_space = gym.spaces.Discrete(2 * len(maze.shape))
def step(self, action):
state = self.reset()
print(action)
reward = 1
done = True
info = {}
return state, reward, done, info
def reset(self):
return np.ones(2)
O action é sempre: [0. 0. 0. 0.]