2008-10-01から1ヶ月間の記事一覧
http://pc.watch.impress.co.jp/docs/2008/1031/kaigai474.htm マスクレジスタってどっかで聞いた事あったと思ってたら、スパコン用のベクトルプロセッサでも同じものがあるみたいですね。 分岐関連でも面白そうな事が出来そうですし、色々遊んで楽しめそう…
開発もしたいですし、有給含めた三連休は引き籠もります。 んで、参加費と旅費が浮いたから、その分は学習用マシンにつぎ込もうかと検討中。 とりあえず静音化の為にSSD買って、電源もそろそろ新しいのにして…って、ケース以外全とっかえコースですね、こり…
先週末から風邪ひいてて、だいぶ開発が遅れてました。 んで、メタ強化学習の前に、Actor-Criticとしてちゃんと動いてるかどうか確認する為に、迷路脱出タスクを解かせてみる事にしました。 んで、今日はリハビリがてら迷路関連をチョコチョコと。正直、書く…
http://pc.watch.impress.co.jp/docs/2008/1030/tsukumo.htm うーん、大須はPCショップの数自体が少いから、九十九がつぶれたりしたら困りますねぇ。ガンバレ。 てか、Core i7発売直前ってのはタイミングが悪すぎです orz
開発の方はさっぱり進まないです。この分だと、年内に完成も難しいかも… リバーシでの予備実験 TDLeaf(λ)実装。 メタ強化学習で、状態を見て行動選択する様に変更。 メタ強化学習で、状態の表現方法を検討。 εグリーディーとソフトマックス手法の比較。 TDLe…
10/20の開発日記に書いた値でOKでした。
数パターンを自動実行出来る様にしたんで、一晩動かせばOKのはず。まずはパラメータ調整をちゃんとやります。 それから、リバーシもとりあえず学習用マシンで動かしときます。メタ強化学習あり・無しで何か差が出ると嬉しいなぁ…
「構想していた案を実装出来た」ってだけで、まだちゃんと動いてるかどうかすら怪しいですが。 んで、多分学習に時間がかかるんで*1、一晩走らせておきます。 それからGA部分にバグ発見。 以前のデータ採取用に初期値を片寄らせてあったんですが、それがその…
ベストだったのは下記の通り。 個体数:16 世代更新の間隔:50 次世代に残すエースの数:8 突然変異率:0.125 つー訳で、明日からはリバーシでテスト。
以前やってたのだと、パラメータと得られる報酬の期待値のグラフが単峰性になって、ちょっとテストとしては簡単すぎると思い、問題を修正してリトライ。 んで、まずはGAの個体数と世代更新の間隔*1から。 おおざっぱな傾向としてはこんな感じ。 個体数に対し…
http://www.4gamer.net/games/039/G003983/20081018002/ AMD日本法人の公開したロードマップなので、今の所は正確な情報だと思います。 んで、今年中にはサーバ向けのShanghaiが登場して、デスクトップ向けのDenebは来年みたいですね。
実行に物凄く時間がかかってます。 これは、一晩動かさないとろくなデータが取れなさそうな感じですねぇ。困った。
とりあえず10本腕バンディット問題を解くエージェントのメタパラメータ調整をさせてみました。 んで、ちゃんと動いた事は動いたんですが、GAの個体数とか世代更新の間隔*1とかは、もうちょっとちゃんと設定しないといけない感じですね。 今は一パターンの設…
2枚あわせて1枚分の予算で買えました。 ついでに、今更買えないと思ってた新品ですし、結構嬉しいです。
とりあえずコンパイルエラーが出なくなるまでは。動作確認やらデバッグやらは明日やります。
開発中なんですが、チョイと息抜きに。 http://www.gdm.or.jp/voices.html の10/11分。 ASUSのP6T DELUXEが予価\40,000前後だとか。意外と安い。 メモリも3枚組で発売されるみたいですし、順調にパーツを揃えれそうです。 そういえば「11/17に販売解禁となる…
という訳で落としたブツですが、Volari Z7搭載ビデオカードです。 同じチップを載せたボードの紹介はこちら。2D限定で低消費電力なサーバ向けチップみたいです。 という訳で、当然の様に学習用マシンに積む予定。基本的にリモートデスクトップで操作しますか…
行動選択する部分以外は完成。残りは以前のバージョンをほぼ流用可能なはず。 今はJavaで作ってて、後で将棋用にC++に移植する必要があるのですが、とりあえずは移植の事は考えずに実装しています。どうせ何度も修正してぐちゃぐちゃになりますから、移植時…
オークションで落札出来るかが気になって集中出来ません orz 何を入札中かは落としてから書きます。
http://www.watch.impress.co.jp/akiba/hotline/20081011/etc_dynatron.html Xeon 5500(Nehalem-EP)対応って事ですが、Core i7(Bloomfield)も同じLGA 1366なので、多分使えるんでしょう。 Core i7発売時にはクーラーの選択肢が無いかもしれないって思っ…
LANチップのドライバ内でエラー発生→再起動→BIOSの設定が変になる ってコンボが発生していたみたいです。 …BIOS画面すら映らないんでグラフィックカードの不調かと疑って、一時間程ドタバタしてたのはここだけの秘密。 ……CMOSクリアって選択肢がトラブル発生…
http://pc.watch.impress.co.jp/docs/2008/1008/kaigai471.htm リンク先でこれでもかってぐらい解説があるので一言だけ。 こけるなよ、Intelの独走だけは防いでくれ、AMDさん。
あっちこっちのオブジェクト*1に表示すべき情報があって、それをいちいち集めて回るのは手間がかかるので、その辺が楽になる様に。 んで、その修正はすぐに終わって、その後にログを見てみたんですが、どうも探査(色々な行動を試して、今より良い行動を探す…
http://sig-gi.c.u-tokyo.ac.jp/gpw/2008/schedule.html 今後変更される可能性があるそうなので、とりあえずセッションの表題だけ眺めてみました。 で、参加、どうしようか。 初日は有給取ってあるので参加も可能ですが、三日間引き籠もって開発するのも捨て…
4x4のリバーシで実験してみました。 TD(0)・εグリーディー(ε=0.01)・テーブル形式評価関数は成功 TD(0)・ソフトマックス(温度=0.75)・テーブル形式評価関数は成功 TDLeaf(λ)・αβ1手・ソフトマックス(温度=0.75)・テーブル形式評価関数は失敗 TDLeaf(λ)…
http://pc-benchmark.at.webry.info/200810/article_63.html i7の2.93GHzとP6T Deluxeを狙ってるんですが、意外と安いです。 まぁ、あくまでユーロの価格なんで、日本で同じ値段になるとは限りませんが。
まずリバーシ用にソフトマックス方策を実装。εグリーディーよりは良さそうですが、4x4のリバーシでも最適解は発見出来ず。 以前に多碗バンディット問題で実験した感じでは、ソフトマックス方策はメタパラメータの少しの差で結果が大きく変わるので、手作業で…
http://www.4gamer.net/games/039/G003983/20081002003/ 45nmプロセスのPhenomは例によって遅れるそうです。2009/2Q以降って話なので、次回選手権に間に合うかはは微妙ですね。 ただ、Opteronの方は今年中には出す予定だそうですから、ひょっとしたらそっち…