2014-08-14 よし 開発日記 とりあえず、合議用評価関数を方策勾配法(SR-PGLeaf)で学習する為のパラメータ更新則を計算しよう。 んでもって、連休後半で一気に実装…は、無茶かな? まぁ、出来る所までやるつもりで。