現在の状況
この前書いた全幅1手+静止探索4手での学習を動かすと、一晩どころか1時間もたたずににエラー吐いて止まってました。
で、その原因が評価関数のパラメータ調整ルーチンのバグ&千日手の評価値の扱いのバグだとやっと判明したのが昨日の夜。
その後とりあえずシングルスレッドとマルチスレッドのバージョンを別々のマシンで動かして、それは一晩ちゃんと動いてました。
そういう訳で、静止探索4手で学習したパラメータを引き継いで学習用マシンで走らせてます。対局数は1日14〜15万局って表示になってるんで、ざっと一桁遅くなってますが、まぁこれ位ならOKかも。
今やってる学習は「成功すればラッキー」位のつもりでやってるんで、万が一失敗しても選手権は何とかなりますし、気楽にやってます。