「知的ナノ構造体」???
http://www.riken.jp/pr/press/2013/20130809_1/
はてブ経由で拾ってきたニュースで、まだよく理解出来ていないんですがとりあえずリンク。
んで、まずこれは突っ込まざるをえないのでとりあえず。
そして、このアルゴリズムが多本腕バンディット問題の正解を探索できること、さらに、同問題の解法の中で、最速とされていたアルゴリズム「Softmax法」よりも、速く正確な意思決定が実現できることを、シミュレーションにより実証しました。
http://www.riken.jp/pr/press/2013/20130809_1/
多腕バンディット問題ではSoftmaxよりUCB1の方が優秀なはずですが、その辺は完璧にスルーされていますね。まぁいいですけど。
それはとりあえず置いといて、アルゴリズムの概要がよく分かんないです。
2本腕バンディット問題で、一方の腕を試してプラスの報酬が得られたらその行動を強化する*1、得られなかったらもう一方の腕を試す行動を強化するって事なのかな? いやでも、そんな単純な事ならわざわざ発表する様な内容じゃないしなぁ…
プレスリリースを見た感じだと量子ドットとかって単語が出てるので量子コンピュータ向けのアルゴリズム?
一番下のパフォーマンス比較を見る限りではSoftmaxより優秀そうではあるのですが、果たしてコンピュータ将棋に応用出来るのか。もうちょっと理解を深めないと判断つきませんね。
*1:次回も選択する確率を上げる