2010-11-09から1日間の記事一覧
方策勾配法でパラメータ数が多い場合に学習出来ないとすると、それじゃぁその次はどうするんだって話です。 んで、今はざっと二つ案があります。 頑張って方策勾配法で何とかする。 TDLeaf(λ)やTreeStrap(αβ)に戻る。 出来れば前者で何かしたいけど、現状で…
長すぎ&重すぎ。 ファイルサイズ見たら112KBだった。無駄に色々書いてるなぁ。
相変わらず方策勾配法で学習出来ないかやってます。 んで、まだ5五将棋でsspにもTDLeaf(λ)バージョンにも追いつけてないので、思い切って設定変えたのを投入。 評価項目を駒割+筋・段個別の絶対位置評価+王将の移動可能範囲(距離3まで)に変更。 パラメー…