2010-10-25 VS ssp(5五将棋モード) 開発日記 学習経過 TDLeaf(λ)のパラメータを引き継いで方策勾配法で半日学習させたヤツ。 結果、139??-560で勝率19.9%。95%信頼区間は17.0〜23.0。 誤差程度しか強くなってないですね。う〜ん、どういう事だろう…