2016-08-15 まだまだデータ採取中 開発日記 先手と後手で評価関数のインスタンスを分けて、別個に学習した結果です。 まず、正則化無し・開発用マシンで実行。 次に、正則化有り・学習用マシンで実行。 正則化有りの方は何か結果が変ですが、とりあえずは無視して上の正則化無しの結果だけ検証。 後手の勝率が一旦上がってから下がる現象が起きていますが、勝率は先後ともちゃんと上昇しています。 という訳で、今度は先手のみ・後手のみの学習をさせてみて、それで同じ結果になるか検証してみます。 例によって、結果は明日朝以降です。