2014-05-10 さて 開発日記 今日からはSoftmax実現確率探索の遷移確率学習を始めるわけですが、当たればR+500というデカい博打です。 学習則がやや複雑なのでエンバグしないか心配ですが、まぁ何とかしましょう。 目標としては土日のうちに学習ルーチンを実装し、来週いっぱいかけて学習を回してみます。 …R+500って事は対sspの勝率が77%→98%くらいの向上ですが、さすがにそれはあり得…るのか!? 乞うご期待!!!