電王トーナメントに向けて
Softmax実現確率探索のパラメータ学習はひとまず保留として、αβ探索のコードを復活&テスト中。
選手権時の評価関数パラメータを使用して、現行バージョン(トーナメントに出すやつ)と選手権バージョンで連続対戦中。
現在8-1-7なので、多分エンバグはしていない。念の為もう少し連続対戦させますが。
んで、後は思考時間制御を修正して、ハッシュのサイズとかの細かいパラメータは現地で調整しますか。
それから、荷造りして名刺作ってやれば、電王トーナメントの準備はOKかな。
Softmax実現確率探索のパラメータ学習はひとまず保留として、αβ探索のコードを復活&テスト中。
選手権時の評価関数パラメータを使用して、現行バージョン(トーナメントに出すやつ)と選手権バージョンで連続対戦中。
現在8-1-7なので、多分エンバグはしていない。念の為もう少し連続対戦させますが。
んで、後は思考時間制御を修正して、ハッシュのサイズとかの細かいパラメータは現地で調整しますか。
それから、荷造りして名刺作ってやれば、電王トーナメントの準備はOKかな。