棋力順調向上中
「AlphaGo Zeroの真似をしようとしたらいつの間にやらほぼ別物になっていた学習ルーチン*1」で、2日かけて100万局の自己対局が終わったんで、途中経過をペタリ。
5五将棋モードで、対sspのハンディキャップマッチ(GA将0.17秒、ssp1秒)です。
ほぼ線形に勝率が向上しているので、このペースで行くと200万局で勝率60%、300万局で90%ですね。まぁ、そう上手く行かず、どっかで頭打ちにはなるでしょうが。
んで、「Dropoutを用いた多数決合議の省メモリ&高速化案」が有るんですが、どのタイミングで実装しますかねぇ。
今やっちゃうと高速化の影響で棋力検証*2に影響出ちゃいますので、実装だけして有効にするのは後日、ってのがベストかなぁ。