GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

学習と統計の境界線

 Selene日記さんのエントリに反応してみます。

 境界線っつーモノがあるのかどうなのか知りませんが、私の場合処理の途中に「能動的な何か」が入ると学習っぽいなー、と感じます。

 例えばボナンザメソッドだと探索がありますし、自己対戦での学習だと探索・評価して自力で棋譜を作る処理があります。

 で、そういう処理があると、単なる統計ではなく学習になるんじゃないかと。統計って言うと、何らかのモデルを仮定して、それに合う様にサンプルから得た情報を処理する感じですから。

各種強化学習用のアルゴリズムも、内容だけ見ていると学習できそうな気がするんですが、将棋に置き換えて実施してみると成果を出すことが難しいです。

とは言うものの、教師なし学習は非常に興味深いので平行して続けていきたいなあ・・。その前に平行できるパソコンを買わなくては。勝敗に関係なくやるなら断然教師なし学習ですね。

http://d.hatena.ne.jp/SeleneShogi/20120202/p1

 これに関しては全く同感。強化学習はなかなか成果が出てないですけど、やってて楽しいんで続けられてます。

 まぁ、どうせやるなら勝敗にもこだわりたい所ではありますが。