2012-11-06 アサーション外したら一気に強くなった 開発日記 学習経過 現在ssp相手に15-0-5。あ、書き忘れたけど5五将棋です。 んで、勝率75%キッカリになりました。キリが良いんで80%まで行ってくれると嬉しいなぁ… 学習は方策勾配法の派生アルゴリズム(今度GPWで発表するやつです)を使い、探索は全幅1手+静止探索(1段目6手)です。 現在はパラメータを引き継いで全幅2手+静止探索で学習中。明後日夜までに4万局程学習出来るはずなんで、GPW杯にはそのパラメータを持ち込む予定。