Softmax実現確率探索 まだまだ実装中
遷移確率でオーダリングした時の最善手の位置が、平均3手目までは下がる様になりました。
が、一旦3手前後まで下がった後6〜7手まで上昇するって現象が発生。
始めはどっかの変数の初期化漏れとかを疑っていたんですが、プロセスを殺してから再度走らせても同様の現象が発生。
という訳でパラメータ更新則の間違いって線が濃厚になってきたんで、今からその辺調べてみます。
遷移確率でオーダリングした時の最善手の位置が、平均3手目までは下がる様になりました。
が、一旦3手前後まで下がった後6〜7手まで上昇するって現象が発生。
始めはどっかの変数の初期化漏れとかを疑っていたんですが、プロセスを殺してから再度走らせても同様の現象が発生。
という訳でパラメータ更新則の間違いって線が濃厚になってきたんで、今からその辺調べてみます。