Softmax実現確率探索 実装中
とりあえず探索して、着手評価関数の勾配を計算するのに必要なデータを収集する所までは実装完了。
んで、パラメータ更新部分が以前のバグ持ちバージョンなので、明日にはそこを修正予定。
とりあえず、アサーション有効にして一晩走らせてみます。
とりあえず探索して、着手評価関数の勾配を計算するのに必要なデータを収集する所までは実装完了。
んで、パラメータ更新部分が以前のバグ持ちバージョンなので、明日にはそこを修正予定。
とりあえず、アサーション有効にして一晩走らせてみます。