GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

荒ぶるHistory Heuristic

 ARPSによる実現確率探索の学習中です。

 56,000局程学習させたパラメータセットですが、大抵のパラメータが0.15以下なのにHistory Heuristicのパラメータは1.5前後。

 出現頻度高い&そこそこ信頼出来る特徴量だから値が大きくなってるんでしょうが、さすがにこれは大きすぎる気が。

 正則化を実装すれば値の発散は抑えられるでしょうが、そうするとまたメタパラメータチューニング地獄にハマりそうな気がしますし…

 う〜ん、どうしようかな。