線形評価関数+強化学習+カーネル法、行けるかも
カーネル法による構造データマイニングって論文(2ページ目)にカーネル関数の使い方が載ってますが、これを読む限りでは表題の組み合わせ、行けそうです。
TD法ならほぼ確実に、方策勾配法でも多分OK。
上手く行けば「化ける」可能性あるし、ここはいっちょ気合入れてやってみますか。
カーネル法による構造データマイニングって論文(2ページ目)にカーネル関数の使い方が載ってますが、これを読む限りでは表題の組み合わせ、行けそうです。
TD法ならほぼ確実に、方策勾配法でも多分OK。
上手く行けば「化ける」可能性あるし、ここはいっちょ気合入れてやってみますか。