思考時間を変えてみた
No. | 駒割 | 持ち駒の組み合わせ | 筋・段個別の駒の絶対位置 | 駒の絶対位置 | 二駒相対位置関係 | 二駒絶対位置関係 | 三駒の相対位置関係 | 探索ルーチン | 勝率 | 95%信頼区間 | 対局数 | 学習時の探索深さ | 備考 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
B1 | ○ | ○ | ○ | ○ | ○ | - | - | 200Kノードで打ち切り・詰将棋ルーチン無し | 62.2(406-?-247) | 58.3〜65.9 | 109,300 | 1手+静止探索6手 | |
B2 | ○ | ○ | ○ | ○ | ○ | ○ | ○ | ↑ | 68.6(162-?-74) | 62.3〜74.5 | 368,800 | ↑ | |
B3 | ○ | ○ | ○ | ○ | ○ | ○ | ○ | 1手1.95秒・詰将棋ルーチンあり | 72.7(488-?-183) | 69.2〜76.1 | 368,800 | ↑ |
あんまり勝率伸びてないですね。前からこういう現象はあったんですが、何なんでしょうねぇ。
自己対戦学習の条件が全幅1手+静止探索だから、早指しに特化した評価関数になってて、思考時間を伸ばしてもあまり変化が無い? それとも探索の効率が悪いから、思考時間が3倍前後になっても大して読む深さが変わってない?
詰将棋ルーチンの有無も関連してるかもしれないんで、今度は1手800Kノード(これで大体1手2秒考える位)にしてやってみますか。