GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

探索を深くして学習させてみます

 ベイズ線形回帰とかカーネル法とか自然方策勾配とか色々試してみてもダメだったんで、前のまま(線形の評価関数+方策勾配法)で探索を深くしたバージョンをしばらく学習させてみます。

 探索は全幅2手+静止探索一段目8手。これとは別に、方策内部で1手全幅で読んでます。

 全自動で最新のパラメータファイル取得&連続対戦をするプログラムも一部完成したんで、とりあえずこれを使ってLesserkai相手の勝率を測ってみます。