実験結果 続々続くらい?
全局面の平均二乗誤差
- | 着手数あり | 着手数なし |
---|---|---|
開放度あり | 5.06 | 6.43 |
開放度なし | 5.61 | 6.15 |
対局中に表れた局面の平均二乗誤差
- | 着手数あり | 着手数なし |
---|---|---|
開放度あり | 1.97 | 2.69 |
開放度なし | 8.89E-4 | 1.50 |
今回は着手可能数あり・開放度なしだけが学習成功。まだ学習率の変化が速すぎるんでしょうか。
ちなみに、今日の早朝に目が覚めた時にいっぺん学習を中断して、新規に再開しているのですが、中断した時は2つは成功していたはずです(うろ覚え)。
んで、久々に学習結果のログをちゃんと見てみました。
どうも、学習率*1とε*2が0.01を切ると学習が進まなくなるみたいです。
という訳で、今夜は一晩かけて1.0から0.01まで変化させてみます。
と、その前に今日の開発。
昨日実装した、進行度と二つ*3のパラメータを使った評価関数の効果がいまいち不明なのですが、どうもεが大きい場合はどうあがいてもちゃんとした学習が出来ないというのが原因らしいです。
という訳で、昨日の実装とその前の実装の二つを、学習率・εを0.05か0.01固定で1時間ほど走らせてみます。