学習率を変化させる様に修正
いきなり低い学習率で始めると、いまいち学習が遅い様に感じています。かと言って高くすると収束しないし。
そこで、評価関数(CompositeEvaluatorクラス)に学習率のgetter・setterを実装して、外部から学習率をいじれる様にしました。
変化させるのは棋譜を一通り学習したら後のタイミングで、学習率を0.995倍する様に修正。学習100回(約50分)で半分程度になるので、20時間も回せば収束するはず。あ、学習率の初期値は3桁上げました。
さて、吉と出るか凶と出るか、明日には分かるはずです。上手く行ったらパラメータをセーブ・ロードする部分を作って、その後は評価関数の追加予定。