OpenAI _CarRacing-v0
_環境でRLエージェントをセットアップしたいのですが、その前にアクションスペースを理解したいと思います。 githubのコード 行で119さんのコメント:
_self.action_space = spaces.Box( np.array([-1,0,0]), np.array([+1,+1,+1])) # steer, gas, brake
_
この行を読むにはどうすればよいですか?私の問題は具体的なwrt _CarRacing-v0
_ですが、spaces.Box()
表記について一般的に理解したいと思います
Box
は、実際の値の数量を扱っていることを意味します。
最初の配列_np.array([-1,0,0]
_は受け入れられる最小値で、2番目のnp.array([+1,+1,+1])
は受け入れられる最大値です。この場合(コメントを使用)、3つの使用可能なアクションがあることがわかります。
[-1, 1]
_で実際の値[0, 1]
_で実際の値[0, 1]
_で実際の値