2014-06-06 VS ssp(5五将棋モード) 開発日記 学習経過 SR-PGLeafで評価関数と探索ルーチンのパラメータを同時に学習させたもの。 結果、569-?-59で勝率90.6%。95%信頼区間は88.0〜92.8。 期待していた程は勝率が上がってないですが、とりあえず次は本将棋の方で学習させたのを試してみます。