2011-01-18 そういや学習アルゴリズム 開発日記 TD(λ)-MCって選択肢もあったんだ。 でもあれはモンテカルロ木探索でそこそこの精度が無いとダメだし、今のままじゃ難しいか。 と言うか、TD(λ)-MCって、単純にモンテカルロで対局するのとどっちが強いんだろう? もしモンテカルロと大差無いなら、素直にモンテカルロ使った方が得策だよなぁ。