2016-10-26から1日間の記事一覧
DQNを実装して5五将棋で学習させてみたんですが、TD誤差が一向に減らないという問題が有って、これは一旦保留。 んで、表題の手法のコード(前に書いた)を引っ張り出して来て、テスト&デバッグ中。 やる事はシンプルで、評価関数インスタンスを多数生成し…
DQNを実装して5五将棋で学習させてみたんですが、TD誤差が一向に減らないという問題が有って、これは一旦保留。 んで、表題の手法のコード(前に書いた)を引っ張り出して来て、テスト&デバッグ中。 やる事はシンプルで、評価関数インスタンスを多数生成し…