将棋とアンサンブル学習って出来ないもんなんだろうか
http://www.computer-shogi.org/blog/computer-shogi-colleague_at_symposium/
CSA例会で合議制将棋の話題があったらしいんですが、それに関連して。
教師あり学習の分野ではアンサンブル学習という、複数の学習器*1を組み合わせて、より高性能な学習器を作ろうって手法があります。
で、例えばボナンザメソッド+アンサンブル学習で強い将棋ソフトが出来ないかな−、とふと思いました。
バギングなら特にアルゴリズムの変更は不要でしょうし、ブースティングも目的関数をいじれば出来そうな気もします。
Bonanzaのソースが公開されてるんだから自分で試すって手もありますが、とりあえずは強化学習に集中したいんでパス。選手権後に時間があればやります。
回帰(関数近似)だとArcing_RAって手法が提案されてるみたいですから、とりあえず論文を読んでみます。ひょっとしたら強化学習と組み合わせれるかもしれませんし。
*1:将棋では評価関数とか