GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

今日の予定

 MC Softmax 探索における局面評価関数の学習

 GPW 2018で五十嵐先生に発表してもらった上記論文(五十嵐先生・山本一将さんとの共著論文)ですが、理論の提案だけで学習実験がまだです。

 という訳で、実験用にプログラムの修正作業をするのが一つ。

 それから、エントロピー正則化が実装出来そうな感じなので、並行してそれもやっていきます。

 時間はたっぷり有るんで、両方完成すると嬉しいなぁ。