2009-12-08 方策オフに修正中 開発日記 旧バージョンは方策オン・オフどちらも実装していて、新バージョンは方策オン学習のみだったので、新バージョンにも方策オフモードを実装して統一する事に。 これで、強化学習部分・探索・評価関数のほとんどが新旧両バージョンでほぼ同じアルゴリズムに揃えれる様になったので、一度新バージョンで学習させてみます。 と言っても、学習用マシンはあと3日は旧バージョンを走らせる予定なので、その間にデバッグとかして、それからですね。