GPW2001の論文集が届きました
とりあえず興味の有る所から読んでますが「合議のための多様な将棋プレイヤの集団学習」が面白かったです。
基本的にはBaggingで、それに加えてModel-based NCL(Negative Correlation Learning)という手法で、評価関数のパラメータ調整時に各プレイヤー間で棋風に違いが出る様にするらしいです。
この論文ではボナンザメソッドをベースにしているらしいですが、強化学習でもMNCLは利用可能だと思うので、一度試してみたいですね。
他にも色々読みたいのはあるのですが、時間が無いのでちょっとずつ読んでいこうと思います。