昨日書き忘れた分
多数決合議の思考ルーチン部分は完了。学習部分は未完成。
今の学習用マシンはCore i7で8スレッドなので、評価関数も8通り用意しました。
- 二駒の相対位置関係
- 王将の移動可能な範囲
- 駒の自由度
の3つの評価項目それぞれのオン/オフの組み合わせ計8通りです。この他、駒割と駒の絶対位置評価は全評価関数共通でオン。
んで、試しに一つのパラメータファイルを使って(オフになっている項目のパラメータは無視して)対局させてみたんですが、これは弱かったです。
どうも、評価項目が少ない評価関数を使った探索ルーチン達が、共通の間違いをしている雰囲気です。
という訳で、今日は各評価関数が個別に学習する部分を作る予定。