GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

さて、次はどうしようか?

 とりあえずやりたい事。

  • 方策勾配法のテスト
  • 合議とTDLeaf(λ)/方策勾配法を組み合わせてみる
  • 評価関数の改良(正則化ベイズ回帰を導入)
  • 自己対戦学習時にABC探索を使ってみる
  • 本将棋でテスト

 とりあえずは上から順番にやってみようかなぁ…

 あ、さっきからやってる連続対戦は現在7-0-9で負けが先行。ひょっとして、過学習してるのかな?