またまた方針転換
簡易版ボナメソとかプランニングはやめにして、強化学習一本槍で行きます。
んで、現状の自己対戦ではどうも強くなる限界がありそうなので、ボナンザ先生に教えて貰う事にします。
具体的には、ボナンザ3手読み相手に対局し、その結果*1から学習ってのを考えています。現状のGA将!!!!の強さを考えると、ボナンザを将棋の神様と見立てて学習してもいいでしょうし。
とりあえず、ライブラリルールとかその辺のからみもあるんで、CSAと保木さんに問い合わせて、返信来るまでにコード改造の可否をチェック&設計ですね。
u2bがある事だし、対局相手との通信をUSIにしておけば後々便利かな? 使い慣れたインタフェースなら扱い易いだろうし。
後はTDLeaf(λ)クラスの改造ですね。自己対戦前提で作っちゃってるんで、どの程度の規模の改良になるか、その辺心配です。
*1:ほぼ100%負けると思いますが