GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

今更UCB1の勉強してます

 http://homes.di.unimi.it/~cesabian/Pubblicazioni/ml-02.pdf

 どうもDiscounted UCB1はUCB1に割引率(?)の項を付け加えた感じらしいんで、まずは基本のUCB1からやってみようかと。

 とりあえずUCB1とDiscounted UCB1を今日中に実装して、多腕バンディット問題でテストする所までは持って行きたいですね。可能なら、定常環境・非定常環境両方でテストしたい。

 つー訳で、テスト用コードを久々にJavaで書いてみます。最近C++ばっかだったんで、なんか懐かしい。