2010-11-09 設定変えて学習用マシンに投入 開発日記 相変わらず方策勾配法で学習出来ないかやってます。 んで、まだ5五将棋でsspにもTDLeaf(λ)バージョンにも追いつけてないので、思い切って設定変えたのを投入。 評価項目を駒割+筋・段個別の絶対位置評価+王将の移動可能範囲(距離3まで)に変更。 パラメータの数は大分減ったと思うので、パラメータ数が問題になっていたのならこれでOKのはず。 それから、学習と並行して、ソースのチェックも再度してみます。まだ、どっかにバグが残ってる感じなので。