wwymak
/

ppo-LunarLander-v2

Reinforcement Learning

stable-baselines3

LunarLander-v2

deep-reinforcement-learning

Eval Results

Model card Files Files and versions Community

ppo-LunarLander-v2 / results.json

wwymak

lunar lander default training, 1e6 timesteps

4985d07 over 2 years ago

raw

history blame

164 Bytes

{"mean_reward": 266.04991410711995, "std_reward": 22.73387900590312, "is_deterministic": true, "n_eval_episodes": 10, "eval_datetime": "2022-05-08T19:30:06.285500"}