一個上ですが、なんか地が出ちゃってました。いかんいかん、ちゃんと猫かぶっとかないと色々ヤバイです。
んで、今までの成果は表題の通り。成果ゼロ。
ただ、それだけだと時間が無駄になっちゃうんで、対局数を3000で打ち切りにして実験をリトライしてみます。
今日まで一晩分だと対局数が多過ぎて、最終的にε*1が0に近過ぎる値になっていました。
で、ひょっとしたらεの影響で学習が進まなかった可能性があるので、ある程度の所で打ち切る様に、という事です。
さて、そんじゃぁ印刷した評価関数のソースでも読んでみます。ひょっとしたら印字したやつの方だと何か発見出来るかもしれませんし。