第24回世界コンピュータ将棋選手権 反省会場
ではまず、選手権で頻出した課題局面から。将棋所の画面を使わせて頂きました。
はい。初期局面です。
GA将!!!!!!!が先手番で指した手は、大抵7八金です。で、それを見た相手はほぼほぼ飛車を振ります。
自己対戦での学習時に、GA将!!!!!!!は居飛車ばかり指していたみたいです。なので、7八金は「どうせ相掛かりになるから、とりあえず角頭を守っておこう」という狙いだと思います。
で、後手としては「後手が振り飛車にすると7八金は悪形だから、飛車を振ろう」と考えたんじゃないかと。
実は、この辺の事は選手権で対局相手の方に解説してもらうまで分からなかったんですが、言われてみれば確かに、という感じです。
で、同じ様な問題(相手の戦型・狙いを決め打ちして指している)は他の局面でも起きている可能性が高いので、これは解決しないといけない問題です。
という訳で、対策としては居飛車・振り飛車をどちらも指すオールラウンダーを目指して学習するってのが手っ取り早そうです。
具体的に言うと、自己対戦学習時の指し手選択のランダムさを増して、学習中に色々な手を試す必要があるかと思います。
試す手が増えると学習が収束するまでにかかる時間・対局数が増えるでしょうが、その分伸び代も増えるはずなので、じっくり学習させてみます。
それから、課題局面はもう一つあるんですが、そっちは評価関数の改良(一部非線形にする)と絡んでくるので、後で書きます。