GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2016-10-26から1日間の記事一覧

PGLeafとアンサンブル学習を組み合わせた手法を実験開始

DQNを実装して5五将棋で学習させてみたんですが、TD誤差が一向に減らないという問題が有って、これは一旦保留。 んで、表題の手法のコード(前に書いた)を引っ張り出して来て、テスト&デバッグ中。 やる事はシンプルで、評価関数インスタンスを多数生成し…