GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

カルマンフィルタを用いた強化学習

 Kalman Temporal Differencesという、TD法とカルマンフィルタを組み合わせた手法は存在する様なのですが、方策勾配法でも同様の事が出来ないかと検討中。

カルマンフィルタの基礎

カルマンフィルタの基礎

 現在はこの本を買って勉強中ですが、制御理論に関してはズブの素人なので難しい事この上無いです。

 まぁ、1ヶ月程度かけてボチボチと理解していくつもりです。

 ちなみにこれはプランBで、これとは別のプランAも並行して実装中なんですが、そっちは実験が上手く行ったらブログに書きます。