とりあえず一晩学習させてみた
学習率は0.1から始めて、2万局後に0.001になるように減少させてみました。
正則化係数は1e-3〜1e-10まで8通り。
んで、結果。各パラメータをLesserkaiと20戦させてみました(途中で打ち切ったのもありますが)。
正則化係数 | 勝敗 |
---|---|
1e-3 | 1-0-19 |
1e-4 | 1-0-9 |
1e-5 | 0-0-1 |
1e-6 | 16-0-4 |
1e-7 | 14-0-6 |
1e-8 | 18-0-2 |
1e-9 | 18-0-2 |
1e-10 | 20-0-0 |
見てるとどうも序盤が変なので、ランダムオープニング*1の長さを2に変えてやってみます。
正則化係数は1e-6〜でいいかな。それ以上はちょっと論外な感じですし。
*1:学習時に序盤はランダム指しにする