新パラメータを順次投入
学習用マシンで学習させたパラメータを定期的にfloodgate参戦用マシンに書き込み、floodgateでは常に最新のパラメータを使用する様に変更。
これに伴い、学習初期のレーティングの変化を見たいので、学習はパラメータを引き継がずに最初からやり直し。
多分、当面は駒割すら怪しい感じで負けまくると思います。どの程度の期間でどれだけ強くなるか楽しみ。
参考までに今日までの学習分だと、40万局経過後のパラメータで対sspの勝率6割。ただし、対局数が40位なので、大分怪しい数字です。