2016-08-10 どうぶつしょうぎモードは断念&新学習アルゴリズムの実装開始 開発日記 神様相手に学習するのは無理ゲーすぎる感じです。 んで、5五将棋・本将棋用に原始モンテカルロと方策勾配法を組み合わせた学習アルゴリズムを実装中。 とりあえずプレイアウト部分のベンチマークを書いたけど、6コアマシンで340k playout/secは出た。 速度的な問題はクリア出来そうなので、後は対局・学習部分をゴリゴリ書いていきます。