細々色々調整中 - GA将？開発日記～王理のその先へ～

　評価関数の出す値が-1から1になるはずがどうも変な値を出してると思ったら、学習率やλが影響していたみたいでした。

　元々0.1と0.99だったのを、学習率だけ0.01にしたりλも0.7にしてみたらOKになりました。

　結構色々と強化学習関連の経験値が不足している感じなので、じっくり腰をすえてやってみます。ニューロで評価関数作るのは次回選手権後に持ち越し。

　んでもってTODOリストを更新。TDLeafを予定に入れたり、優先順位を変更したり。