GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

今後の方針について検討中

 方策勾配法でパラメータ数が多い場合に学習出来ないとすると、それじゃぁその次はどうするんだって話です。

 んで、今はざっと二つ案があります。

  1. 頑張って方策勾配法で何とかする。
  2. TDLeaf(λ)やTreeStrap(αβ)に戻る。

 出来れば前者で何かしたいけど、現状では何も案無し。厳しいっす。