2007-09-26 細々した改良 開発日記 なんだかんだで色々やりましたが、細かい事だし読んでも面白く無さそうなのでパス。 大きい改良は評価関数専用のメタ強化学習エージェントをを作って、平均二乗誤差が最小になる様に学習率の調整をさせようとしました。 が、これは失敗。色々原因は考えられるのですが、明日ゆっくり考えてみます。