2014-08-13 さて 開発日記 今日から盆休み(5連休)な訳ですが、何しようか? とりあえずGA将!!!!!!!!の開発をするのは確定としても、選択肢が色々。 探索ルーチンの強化(本将棋で全幅3手位で学習させたい) 方策勾配法での合議用評価関数等の学習 評価関数の改良(非線形化・評価項目追加) デバッグ RazoringとかDelta Pruningとかってのはまだ実装していない*1ので、その辺の事からやってみようかな。 ただなぁ、浅い探索で枝刈りすると結果が不安定になる気がするし、その辺どう折り合いをつけたものか… *1:と言うか、どういう手法か調べてもいない