一晩分 約7000局
使用頻度の高いパラメータはそこそこ学習しているものの、駒の絶対位置のパラメータは微妙。二駒の相対位置は見てない*1。
絶対位置のパラメータを見てみると、どうも似た様な位置にしか駒を動かそうとしていない感じです。
で、その影響で他の場所のパラメータがほぼ0のままになっている、と。
という訳で付け焼き刃的にid:streakeagle:20080424:1209043919で書いたものを実装してみます。
対局開始から数手はランダムに手を選ぶので、上手く行けばいろんな状況の学習をしてくれる、かもしれません。
学習関連のパラメータは、学習率0.01で固定。ランダムに手を選ぶ回数は2,4,8,16の4通りにしました。
*1:と言うか、まだ整形するプログラムが出来ていない