GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

ソースのチェック&学習の修正

 結局、評価・学習やパラメータの保存には怪しい部分がありませんでした。

 で、今までは探索で詰みを発見した場合は学習しない様にしていたのですが、これを詰みを発見した場合は勝ち・負けの時に得る報酬を目標に学習する様に修正。

 元々、探索で詰みを発見した場合は、もう一度同じ条件で探索すれば同じ様に詰みを発見出来るので、学習は不要と考えていました。

 けれども、よくよく考えると探索中に末端近くで詰みそうな局面があった場合に、評価関数がちゃんと詰んでると判断出来た方がいいので、詰んでる時も学習させる事に。

 で、一昨日と同じ条件でリトライさせてみます。これで吉と出るか凶と出るか。明日が楽しみです。