Factorization Machineを使用した疑似四駒関係は結局上手く行きませんでした。
という訳で、PPT+αで何とか強くしようと色々いじってます。
とりあえず、今までは割引率γを1に設定していましたが、これだとチョットぬるい手を指す事があるので、γ=0.99で学習させてみました。
んで、途中経過。現在ssp相手に147勝27敗で勝率84.5%。結構強くなりました。
ただ、角頭をちゃんと守らなかったり、飛車先の歩をなかなか突かなかったりと、見ていて何か変な感じ。まぁ、学習が足りていない可能性もあるので、もうちょっと様子見します。