一晩分約7000局 - GA将？開発日記～王理のその先へ～

使用頻度の高いパラメータはそこそこ学習しているものの、駒の絶対位置のパラメータは微妙。二駒の相対位置は見てない*1。

絶対位置のパラメータを見てみると、どうも似た様な位置にしか駒を動かそうとしていない感じです。

で、その影響で他の場所のパラメータがほぼ0のままになっている、と。

という訳で付け焼き刃的にid:streakeagle:20080424:1209043919で書いたものを実装してみます。

対局開始から数手はランダムに手を選ぶので、上手く行けばいろんな状況の学習をしてくれる、かもしれません。

学習関連のパラメータは、学習率0.01で固定。ランダムに手を選ぶ回数は2,4,8,16の4通りにしました。

*1:と言うか、まだ整形するプログラムが出来ていない