先読みを浅くするのは上手く行った模様
学習が収束していませんが、駒の絶対位置の評価のパラメータを見てみると、"飛車先の歩を突くと良い"といった、今までは学習出来ていなかった事もちゃんとパラメータに反映されていました。
ただ、二日かけても駒割の学習すら収束していないので、学習速度に問題があるのかもしれません。
という訳で、学習率を一桁上げて0.01にしてリトライしてみます。
ついでに学習経過のログ出力は、対局数が増えた関係でファイルサイズが大きくなりすぎていました。こいつは1局終了ごとではなく、10局ごとに出力する様に修正。