2018-11-25 今日の予定 開発日記 MC Softmax 探索における局面評価関数の学習 GPW 2018で五十嵐先生に発表してもらった上記論文(五十嵐先生・山本一将さんとの共著論文)ですが、理論の提案だけで学習実験がまだです。 という訳で、実験用にプログラムの修正作業をするのが一つ。 それから、エントロピー正則化が実装出来そうな感じなので、並行してそれもやっていきます。 時間はたっぷり有るんで、両方完成すると嬉しいなぁ。