GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

そういや学習アルゴリズム

 TD(λ)-MCって選択肢もあったんだ。

 でもあれはモンテカルロ木探索でそこそこの精度が無いとダメだし、今のままじゃ難しいか。

 と言うか、TD(λ)-MCって、単純にモンテカルロで対局するのとどっちが強いんだろう? もしモンテカルロと大差無いなら、素直にモンテカルロ使った方が得策だよなぁ。