GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

将棋とアンサンブル学習って出来ないもんなんだろうか

 http://www.computer-shogi.org/blog/computer-shogi-colleague_at_symposium/

 CSA例会で合議制将棋の話題があったらしいんですが、それに関連して。

 教師あり学習の分野ではアンサンブル学習という、複数の学習器*1を組み合わせて、より高性能な学習器を作ろうって手法があります。

 で、例えばボナンザメソッド+アンサンブル学習で強い将棋ソフトが出来ないかな−、とふと思いました。

 バギングなら特にアルゴリズムの変更は不要でしょうし、ブースティングも目的関数をいじれば出来そうな気もします。

 Bonanzaのソースが公開されてるんだから自分で試すって手もありますが、とりあえずは強化学習に集中したいんでパス。選手権後に時間があればやります。

 回帰(関数近似)だとArcing_RAって手法が提案されてるみたいですから、とりあえず論文を読んでみます。ひょっとしたら強化学習と組み合わせれるかもしれませんし。

*1:将棋では評価関数とか