εを1.0〜0.001まで変化させた結果
あんまり進歩せず。
ログファイルをちゃんと見る気にはならないんで、とりあえず保存しといて後で見ます。
んでもって、まだ評価関数のソースを読み終わってないんで、その間に学習用マシンには別の実験をしてもらいます。
やるのは以前試したオプティミスティック初期値*1ですが、駒割だけではなく位置による評価にも設定してみます。
駒割の学習はこれで上手く行っていましたから、ひょっとしたら期待出来るかもしれません。
というか、評価関数の問題かその他の部分*2の問題かを切り分けられれば、それだけでも大分楽になるので。
ただ、オプティミスティック初期値を使うと学習時間がかかると思うので、ちょっとじっくりやってみます。