GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

色々迷走中

 昨日は旧バージョンを引っ張り出してそっちで全幅2手で学習させてみたいんですが、それでもどうも弱くなってる気がします*1

 んで、全幅1手でざっと学習→パラメータ引き継いで全幅2手で学習って流れに問題があるのかと考えて、今度は最初っから全幅2手でやろうかと計画。

 ただ、それだと駒割の学習にすら1週間とかかかるので、今度は学習率を弄る事に。

 今までは収束後半の挙動を重視して学習率は0.001固定だったんですが、それだと学習初期が遅すぎます。

 んで、max( 0.001, min( 1.0, 10.0 / gameCount ) )って感じの式(gameCountは対局数)で学習率を計算する事にしました。これだと、学習率は1.0から始まり、対局数に応じて徐々に減少し、最終的には0.001に落ち着きます。

 とりあえずこれで全幅2手の学習を走らせてみて、上手く行く様ならそれで進めます。

*1:ちゃんと検証してないんで、気がするだけかもしれませんが。