VS ssp(5五将棋モード)
昨夜からTDLeaf(λ)+ソフトマックス(目標探査率0.01)、全幅2手読みで学習させた分。
結果、141-?-575で勝率19.7%。95%信頼区間は16.8〜22.8。
前は80%位いってた筈なんで、何かおかしいですね。
ひょっとしたら、前は1手読みだったかもしれないんで、そっちで再度学習させてみます。
昨夜からTDLeaf(λ)+ソフトマックス(目標探査率0.01)、全幅2手読みで学習させた分。
結果、141-?-575で勝率19.7%。95%信頼区間は16.8〜22.8。
前は80%位いってた筈なんで、何かおかしいですね。
ひょっとしたら、前は1手読みだったかもしれないんで、そっちで再度学習させてみます。