2014-06-20 荒ぶるHistory Heuristic 開発日記 ARPSによる実現確率探索の学習中です。 56,000局程学習させたパラメータセットですが、大抵のパラメータが0.15以下なのにHistory Heuristicのパラメータは1.5前後。 出現頻度高い&そこそこ信頼出来る特徴量だから値が大きくなってるんでしょうが、さすがにこれは大きすぎる気が。 正則化を実装すれば値の発散は抑えられるでしょうが、そうするとまたメタパラメータチューニング地獄にハマりそうな気がしますし… う〜ん、どうしようかな。