学習用マシンのプログラムを差し替え
floodgateのRを見てると、評価関数と探索の変更と強さの関係が「非線形・静止探索のみ < 非線形・全幅1手+静止探索 ≒ 線形・静止探索のみ」って関係になってるみたいなので*1、それなら線形・全幅1手+静止探索にすればさらに強くなるんじゃないかと考えて、そのバージョンを学習用マシンに投入。
評価項目は今まで通りで、パラメータの持ち越しは無し。まっさらの状態でやってます。
とりあえず1週間ほどあれば100万局は行くでしょうから、その辺で一度floodgateに投入予定。それまでは今のパラメータで行きます。
*1:最近は数日ごとにプログラムやらパラメータを差し替えてるんで、ちゃんとRが収束していない可能性もありますが。