GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-08-01から1ヶ月間の記事一覧

Phenomの45nm版の話

http://blog.livedoor.jp/amd646464/archives/51249859.html 来年1月に45nmシュリンク版登場、3月にDDR3対応、それからPhenom FXが4GHzと4.4GHzで登場とか。 最後に関しては正直怪しい噂と感じますが、もし出れば選手権で誰か使ってるかも(それまでに発売さ…

ここ数日間のまとめ

先週から目の疲労がひどくて、コーディングはドクターストップがかかってましたから、頭ん中で色々考える方に時間を使ってました。 んで、どー考えても時間が足りません。年明けから4ヶ月は学習させる時間にあてるとして、開発に費やせる時間はあと4ヶ月。 …

X58チップセットでSLIサポート

http://www.4gamer.net/games/027/G002748/20080828017/ 従来はX58 + nForce200*1構成のマザーでのみSLIをサポートするという話でしたが、方針変更してX58のみでもOKになったみたいです。 ただ、全てのX58マザーがSLIをサポートする訳ではなく、NVIDIAの認証…

WILLCOM D4売れてないのかな…

http://pc.watch.impress.co.jp/docs/2008/0826/willcom.htm オプション加入で電話機がおまけで付いてくる…って、「D4は電話機としては使い物になりません」って言ってる様なもんじゃ…… D4後継のスマートフォンに期待してたんですが、こんな現状じゃぁ過度な…

CUDAを利用した商用エンコーダ

http://pc.watch.impress.co.jp/docs/2008/0826/pegasys.htm Core 2 QuadとGeForce GTX 260の比較で、エンコードの条件次第では最大4.5倍に性能アップだとか。

Core i7ターボモード解説 @ PC Watch

http://pc.watch.impress.co.jp/docs/2008/0826/kaigai463.htm ちゃんと動作すれば性能上がりそうなのは嬉しいんですが、ベンチマーク結果を見る時はターボモードのオン・オフに気をつける必要がありそうなのが面倒ですね。 それより、ここまで宣伝しておい…

Core i7登場時期

http://pc.watch.impress.co.jp/docs/2008/0822/ubiq223.htm OEMメーカの話として、11/10〜11/19あたりで発表という話が出ています。 11/10午前0時発売解禁とかだと嬉しいですね。GPW→深夜販売っていう素敵コンボになります。

NehalemのTurbo Mode

http://plusd.itmedia.co.jp/pcuser/articles/0808/20/news101.html これはYSSベンチの為に実装した機能に違いない! とか妄想してみる。

Larrabee解説記事 @ PC Watch

http://pc.watch.impress.co.jp/docs/2008/0819/kaigai460.htm 冷静に考えると、スカラ部分が初代Pentium相当の構成ってのは、GPUとしてはかなりリッチな構成ですね。 となると、αβでの探索部分もLarrabeeで動かすのも現実的…なのかな。

AMDのShanghaiは2008 4Qに出荷

http://northwood.blog60.fc2.com/blog-entry-2211.html 45nmプロセス化で高クロック化&キャッシュ増量って話ですが、Nehalem相手にどこまで戦えるのか… とりあえずAMDガンバレ。前みたいな失敗だけは勘弁して欲しいです。

Intel CPUロードマップ @ PC Watch

http://pc.watch.impress.co.jp/docs/2008/0818/kaigai459.htm Sandy Bridgeとその派生型が2年間か3年間かは、まだソースによって異なるみたいですね。 それよりも、Sandy BridgeではパフォーマンスCPUの標準コア数が8になるらしいんで、そっちの方が楽しみ…

三目並べでのメタ強化学習実装完了(多分)

昨日書いたバグはマルチスレッドがらみでした。対局終了後にGAの世代交代をしているタイミングで、同時に次の対局が始まると起きるらしいです。 それから、メタエージェントに与える報酬が-1〜1になってたんで、0〜1に修正。やや良くなった感じがするかもし…

三目並べでのメタ強化学習実装中

バグって動きませんorz エージェントが先手・後手で2つあって、その関係でメタエージェントも2つインスタンスがあるんですが、どうもその辺でおかしいみたいです。 あるいは、先手と後手が別スレッドで動作しているんで、そっちの影響かもしれません。 …とり…

AsusのBloomfieldマザーの写真

http://xtreview.com/addcomment-id-6091-view-ASUS-P6T-deluxe.html 2スロット仕様のグラフィックカードを2枚挿すと、後はPCIとPCI Express x4が各1本残るだけですか。学習用マシンに使うなら、まぁそれでもいいかな。 つーか、ノースブリッジとPCIeの位置…

ソフトマックスでやってみました

温度は設定可能な値が0より大きい数なので、遺伝子の値をパラメータの値に変換するのにはシグモイド関数ではなくexpを使いました。 それ以外は問題の性質とかは特に変わらないので、大きな問題は無し。順調です。 さてと、それでは次は三目並べでメタ強化学…

ああああああああああああぁぁっ!?

気が付けば連休が既に半分おわっとる。 ヤバイ。まだ全然開発が一段落する気配がないッス。

メタ強化学習の補足

昨日の開発日記の続きです。 まず、予備実験として(メタ強化学習無しで)εを0.001から1.0まで少しずつ変化させて、得られる報酬を調べてみました。 で、どうやらこのケースでは、εと報酬のグラフは単峰性で頂上付近が滑らかになってる様です。ぶっちゃけて…

調子に乗ってGA + UCB1-TUNEDでメタ強化学習開始

とりあえず多碗バンディット問題をεグリーディーで解くエージェントの、εを設定させてみました。 ちなみに腕は10本で各腕ごとに固定の閾値を設定、乱数が閾値以下なら報酬1.0、閾値より大きければ報酬0.0って条件です。 メタエージェントに与える報酬は、εグ…

とりあえずGA + UCB1-TUNED実装完了

まず練習問題として、多碗バンディット問題を連続値行動に拡張したものをでっち上げました。 これは、行動として一つの実数を選択すると、報酬として1.0または0.0を返す問題で、報酬は乱数が閾値以下なら1.0、閾値より大きければ0.0としました。 閾値はhttp:…

GA + UCB1-TUNED実装中

例によって周辺の細々した部分から作りはじめて、GAの世代交代の部分(ここが中心)だけ手付かず。 ま、この辺は何度も実装してる部分ですし、すぐに完成するでしょう。 明後日から9連休ですが、その間にはメタ強化学習をリバーシで動かすあたりまでは行きた…

NVIDIA & Transmeta

http://pc.watch.impress.co.jp/docs/2008/0807/transmeta.htm またなんか懐かしい名前が… とりあえず、アイドル時の消費電力だけでも減ってくれると嬉しい。

AMDはDirectX / OpenCLで行くらしい

http://pc.watch.impress.co.jp/docs/2008/0807/amd.htm C++からGPUを利用するのが簡単になれば嬉しいなぁ。

UCB1-TUNED再実装完了

GA部分は初期化時にランダムに生成したメタパラメータを使い続ける実装ですが、UCB1-TUNEDの方でその中から良いメタパラメータをを選ぶ事は出来ました。 んで、次はGA部分なんですが、GA将!のソースから引っ張ってくるのは難しそうです。 以前作った時は評…

実装中

GAとUCB1-TUNED以外の細々した部分は完了。 とりあえず明日はUCB1-TUNEDを実装(と言うかこの前作ったソースを修正)して、明後日は初代GA将!からGAのソースを引っこ抜いてきて…今週中にはGA + UCB1-TUNEDは動くかな、という感じです。

これからの予定を整理

まずはメタ強化学習の構成について。 おおざっぱに書くと下の様なイメージです。"→" は矢印の左側の値が右側の挙動を決める、 "⇒" は矢印の左側が右側の値を修正する事を表します。 メタエージェント ⇒ メタパラメータ → エージェント ⇒ 評価関数のパラメー…

続 UCB1-TUNED予備実験中

以前は森北出版の「強化学習」に載ってた多碗バンディット問題の条件でやってたんですが、今度はベルヌーイ分布で報酬を決める方式でやってみました。 んで、やっぱりUCB1よりUCB1-TUNEDの方が優秀ですね。 それから、UCB1-TUNEDの式中の1/4って値は、報酬の…

Larrabee解説記事 @ PC Watch

http://pc.watch.impress.co.jp/docs/2008/0804/kaigai457.htm 「SIMD演算のスループットに片寄ったx86プロセッサ」という意味ではPentium4の正当な後継プロセッサ…なんでしょうか。 RadeonがVLIWでGeForceがスカラですから、有名どころのアーキテクチャがグ…