GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

Actor-Criticの実験で悩む

 いい例題がない。

 いや、本とかネットを見ると倒立振り子*1は頻繁に出てくるのですが、いかんせん物理モデルの実装に自信が無くて。さすがに、モデルが変だと練習にならないでしょうからね*2

 うーん、いきなりメタ強化学習に使っちゃおうかなぁ・・・

 うん、明日一日考えて何も思い浮かばなかったらそうしよう。

*1:棒の一端に支点があり、その支点はレール上を左右に移動可能になっている。この状況で、棒の反対側の端を支点の真上に振り上げるタスク。

*2:でも、変なモデルに対応して学習は成功しちゃいそうだから困る。