今日はほとんど無し
昨日だか一昨日だかに実装した、一局終わる毎に全パラメータを少しだけ0に近付ける、というのが割と上手く行っている様なので、学習用マシンにそのプログラムを移して実験してみます。
てか、耳が痛いのが気になってコーディングに集中出来ない。やる気はそれなりにあるのにこれはしんどいです。
んで、実装の動機ですが二つあります。
まず、これまでは何千局も同じ手順の対局が続いて学習が進まない事への対応。修正後は、長期間使わなかったパラメータが0に近づく事により、別の手を指しやすくなるので、色々な手順を試せるだろうという事です。
二つ目は、将来ニューロで将棋の評価関数を実装した場合に備えたデータ収集。自陣に自分のと金がある様な、めったに出現しない状況で変な評価値を出力しない為に、使用頻度が低いパラメータは徐々に0に近付く様にしたらどうか、という事です。
つーか、相変わらず耳が痛い。