雑多な技術系メモ

自分用のメモ。内容は保証しません。よろしくお願いします。

強化学習

マルチエージェント深層強化学習のベンチマーク用のStarcraftをインストールして、サンプルを実行するまで

starcraft python 強化学習マルチエージェント強化学習

https://github.com/deepmind/pysc2/ のREADMEを参考に READMEにあるようにStarcraftをインストールする。 READMEにリンクされているBattle.netからStarcraftをインストールするこの時にはログインが必要デフォルトでc:/Program File(x86)/StarCraft Ⅱにイ…

【強化学習メモ】model-based RL と model-free RL

強化学習

正直、この２つを明確に分ける必要もないかもしれないが、一応メモ、 model-based RL 強化学習をしながら、環境のmodelを同時に推定し、そのmodelも使いながら学習をする手法例) dyna-q model-free RL 環境のmodelの推定は行わずに強化学習を行う手法例) …

【強化学習】エピソード型学習問題と非エピソード型学習問題

強化学習

強化学習のエピソード型学習と非エピソード学習を区別するためのメモエピソード型学習問題ゲームの終了時にのみ報酬を受け取ることができるような問題例）迷路のような問題。ゴールにたどり着いた時にのみ報酬を受け取ることができる非エピソード型学習…