2007-09-12 1時間ほど走らせた結果 開発日記 着手可能数なし・開放度ありは正しく学習していましたが、それ以外は全部変でした。 ログをみてみると、まだグラフの上がり下がりが激しい(学習があまり進んでいない)状態で学習率を下げてしまっている感じです。 という訳で、一局終了後のメタパラメータの修正量を0.001^(1.0/400000)倍*1から0.001^(1.0/1000000)倍に変更。 これで学習率とかの下がり具合が緩やかになるので、上手く学習してくれる事を期待。 *1:400,000回対局すると0.001倍になる