GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

GPWでの重ね合わせによる評価関数の学習論文

 とりあえず一通り読んで、動作についても理解出来たはずです。

 論文とかid:mkomiya:20090124:1232754122とかで分かりやすい説明があるんですが、あえて一言で書くなら「共有価値(パラメータ)の導入によるスパース回避」って感じでしょうか。

 例えば駒割の学習時に、「歩の1枚目の価値」「歩の1枚目と2枚目の差分」「同じく2枚目と3枚目の差分」って感じのパラメータにした方が良いらしいってのは以前から言われてましたが、そういうのを整理して、一つの手法としてまとめるのが論文の主旨なんでしょう(多分)。

 ただ、自分の評価関数に論文のやり方をそのまんま適用出来るかというと、駒割については既に重ね合わせに近い事をしているし、持ち駒の枚数とか利きの数みたいに「数えれる」パラメータも重ね合わせ済み。絶対位置評価は筋ごと・段ごとの評価もあるので重ね合わせたのと同じ状態。

 という訳で、あとは二駒の相対位置関係の処理くらいですね。重ね合わせれるのは。

 今は「桂馬と成銀の関係」を「桂馬と金の動きをする駒の関係」に重ねれないかって考えてますが、じゃぁ「と金と竜の関係」はどう重ね合わせるか、とか考え出すと難しそうです。「金の動きをする駒と飛車の動きが出来る駒の関係」に重ねれば上手く行くかな?

 まぁ、まずは二駒の相対位置関係の処理を外して動かすんで、ここの重ね合わせをどうするかはぼちぼち考えます。