とりあえずやりたい事
- 合議方策勾配法で学習&学習をマルチスレッド化する
- 金銀桂馬の前進ボーナスを復活させて学習
- 3x3マス内の3駒の相対位置関係の評価を復活
どれも以前実装したものですが、諸事情によりお蔵入りしていたんで復活させたいです。
最後の評価項目の追加は、差分計算無しだとNPSが2/3程度に落ちてたんで、差分計算を実装してから復活の予定。
今週末に全部…は無理そうですが、どれか一つはやりたいですね。
最初の合議方策勾配法は、マルチスレッド化と同時に反復深化を実装して、一番重い評価関数が設定した深さの探索を終えるまでに、他の評価関数(軽い奴)はどんどん深く読ませようかと検討中。
評価項目を駒割+軽い評価項目だけ〜全部入りの重い評価項目まで8種類で合議させるつもりなんで、それぞれの得意分野を活かせる様に工夫してみたいですね。
ただ、マルチスレッド化は再現が難しいバグがどんどん出てくるんで、気を付けないとドツボにはまりそうです。