GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

Softmax実現確率探索 相変わらず実装中

 試しに自己対戦の一棋譜だけを対象に学習させるモードを実装。

 んで、走らせてみると最善手以外の遷移確率が上昇していくという変な現象が。

 明らかにバグなんですが、学習則が複雑なのでどこがバグってるかサッパリです。

 …いっぺん、学習部分をシンプルにしてみる(ルートノードの手だけを学習する、とか)ってのもいいかもしれません。