GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

εを1.0〜0.001まで変化させた結果

 あんまり進歩せず。

 ログファイルをちゃんと見る気にはならないんで、とりあえず保存しといて後で見ます。

 んでもって、まだ評価関数のソースを読み終わってないんで、その間に学習用マシンには別の実験をしてもらいます。

 やるのは以前試したオプティミスティック初期値*1ですが、駒割だけではなく位置による評価にも設定してみます。

 駒割の学習はこれで上手く行っていましたから、ひょっとしたら期待出来るかもしれません。

 というか、評価関数の問題かその他の部分*2の問題かを切り分けられれば、それだけでも大分楽になるので。

 ただ、オプティミスティック初期値を使うと学習時間がかかると思うので、ちょっとじっくりやってみます。

*1:“楽観的な”値をパラメータの初期値にする事で学習を促進する手法。

*2:強化学習や探索ルーチン等