2013-07-30 今度はPGLeaf 開発日記 なんか、ここ数日は日替わりで学習アルゴリズムを変えてます。 んで、パラレルPGLeaf*1でちょっと思い付いたアイデアがあるので、それを実装。現在テスト中(と言うか、アサーション有効で走らせてるだけ)。 やる事は割と単純で、相手の指し手の良し悪しを判断して「ここでこう指したから勝てたんだ」「これは悪手っぽいから自分は指さない様に気をつけよう」って感じの学習が出来る様になる…はずです。 今丁度1局分のログ出力が終わったんで、ざっと眺めておかしな所が無ければ本番投入してみます。 *1:複数の評価関数パラメータを用いるPGLeaf