GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

デバッグ中

 とりあえず、方策勾配法の学習部分は問題が見付からず。

 で、局面からの特徴量抽出部分がバグってるかと考えて、評価項目を駒割+位置評価だけにして学習中。これをベースラインにして、評価項目を追加していってどっかで弱くなるなら、そこで追加した項目にバグがある…ハズ。

 あ、そうだ。評価項目追加による探索速度の変化が勝率に影響しない様に、連続対戦時に探索ノード数で思考を打ち切る様に修正しないと。