2012-04-22 昨夜からの学習 開発日記 王将付近に桂馬・香車・歩がいた時も金銀よりやや少なめに報酬を与える様に変更しました。 で、パラメータ6種類で約3万5千局ほど学習させたやつをLesserkaiと連続対局中。学習率は0.01に設定しました。 まだ収束していない可能性はありますが、とりあえずざっとしたデータが欲しいので、各20局対局させて結果を見てみます。