GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

ようやくsspに勝てた

 前は20戦全敗だったのが、開発用マシンで走らせてたバージョン(内部ノードから静止探索を呼ぶやつ)だと1勝1分18敗に。一つでも勝てる様になったのは、多少進歩したって考えていいのかな。

 ただ、まだ学習がちゃんと収束していない感じがあるんで、学習率を0.1**6開始で1000局で0.1**7まで落とす設定から、5.0 * 0.1**7固定に変更。

 それから、内部ノードでは評価値更新ではなく更新量の設定だけに戻しました。これは、学習用マシンでやってた、内部ノードで評価値更新するだけの修正バージョンの結果があまり良くなかったから。

 にしてもアレか、5五将棋だと一晩で1000局ちょっとは対局出来るから、そろそろ収束しているかと考えていたけど、実はまだまだ収束前なんだろうか? うーん、その辺も一度ちゃんと調べないと。