2017-12-09 VS ssp(5五将棋モード) 勝率62.9% 開発日記 学習経過 損失関数を「報酬との自乗誤差+交差エントロピー+PGLeaf」にしたもので、自己対局数は135万。 結果、606勝357敗で勝率62.9%、過去最高を更新。微妙な向上幅ではありますが。