2010-09-23 将棋用の学習ルーチンを実装完了 開発日記 方策勾配法自体は三目並べと同じ奴を使い回して、主に評価関数まわりの機能追加。 ざっとテストして大丈夫そうなので、学習用マシンはリリースモードで、開発用マシンはアサーション有効で走らせてみます。