GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

とりあえず4x4リバーシは完了

 線形の評価関数を使って、1,000局前後でちゃんと収束する様になりました。

 TD誤差とその予測値の相関係数ですが、0.5前後となりまずまずの値。

 んで、今朝から走らせていた本将棋の学習ですが、9,500局経過後のパラメータでLesserkai相手に17-0-3。

 まだ伸び代はあると思うので、一晩二晩走らせてみてちゃんと強くなるか確認してみます。

 …あ、そだ。学習の並列化はどうしよう。全く考えてなかった。