2012-08-14 なんか、異常に強いんですけど… 開発日記 学習経過 昨夜から方策勾配法・全幅深さ1手で17万局程学習させたやつ。 現在ssp(5五将棋モード)相手に71-?-22で勝率76.3%。95%信頼区間は66.4〜84.5なので、全幅0手より確実に強いですね。 運良く強いパラメータの時に学習を打ち切ったせいかもしれませんが、ここまで強いと、逆になんか不安。