序盤〜中盤の位置評価が過剰に学習されているっぽいんで、その部分の学習率を0.3倍に変更。 他はそのままでパラメータ持ち越しで学習にリトライしてみます。
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。