GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

1時間ほど走らせた結果

 着手可能数なし・開放度ありは正しく学習していましたが、それ以外は全部変でした。

 ログをみてみると、まだグラフの上がり下がりが激しい(学習があまり進んでいない)状態で学習率を下げてしまっている感じです。

 という訳で、一局終了後のメタパラメータの修正量を0.001^(1.0/400000)倍*1から0.001^(1.0/1000000)倍に変更。

 これで学習率とかの下がり具合が緩やかになるので、上手く学習してくれる事を期待。

*1:400,000回対局すると0.001倍になる