GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

今度はPGLeaf

 なんか、ここ数日は日替わりで学習アルゴリズムを変えてます。

 んで、パラレルPGLeaf*1でちょっと思い付いたアイデアがあるので、それを実装。現在テスト中(と言うか、アサーション有効で走らせてるだけ)。

 やる事は割と単純で、相手の指し手の良し悪しを判断して「ここでこう指したから勝てたんだ」「これは悪手っぽいから自分は指さない様に気をつけよう」って感じの学習が出来る様になる…はずです。

 今丁度1局分のログ出力が終わったんで、ざっと眺めておかしな所が無ければ本番投入してみます。

*1:複数の評価関数パラメータを用いるPGLeaf