2013-07-29 TDLeaf(λ) 開発日記 今日までは収束速度重視で学習率0.01でしたが、これだと駒割の評価値が安定しないんで、0.001に変更。 後は適格度トレースを実装したり、レポート収集系を整備したり、温度調整したり。 今日は基本的に細々した改修・調整ばかりでした。 …今週末位には何かドーンと大きい改良したいなぁ。