GA将?開発日記~王の理とは~

ネタ勢最強を目指して絶賛開発中。

ちょっと修正したら、学習の立ち上がりは上々

 PGLeaf+MCからPGLeaf+Q(λ)にアルゴリズムを変更して、昨夜から5五将棋モードで学習中。

 現在、55万局経過後のパラメータでsspと対局中ですが、勝率65%前後。学習序盤としては上々の結果です。

 このまま順調に強くなってくれれば良いんですが、どこまで伸びますかねぇ。