選手権までにやってみたい事
- 二駒相対評価の特徴量を少しいじる(遠い駒同士の関係ほど特徴量小さく)
- 自己対戦の結果からのボナンザメソッド
- 定跡を実装
一つ目は、二駒相対評価の特徴量を1/距離にすると言うもの。遠い駒同士の関係はあんまり重視しなくていいはずなので、それを反映してみようという考えです。
二つ目は、自己対戦をして、勝った側のプレイヤーの手は次回は同じ手を指す傾向がより強まる様に、負けた側のプレイヤーの手は次回は別の手を指す傾向が強まる様にするというもの。強化学習の教科書的にはあんまりよろしくない方式らしいですが、それで強くなる様ならやってみます。
三つ目は…まぁ、序盤がどうにもならなかった場合の保険ですね。出来る事なら定跡に頼らずに何とかしたいですが。