GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-10-01から1ヶ月間の記事一覧

学習用マシンの電源を静穏化

今度は水冷のポンプの音が気になりました。 どうしよう、もうちょっとは静かにしたいけど、空冷でこれより静かなのってあるんだろうか? とりあえず時間が出来たら大須に行って探してみますか。

実験結果

とりあえず1万局×10回はそこそこ上手く行った模様。私がよそ事してる間もけなげに学習してくれて、俺の嫁*1は本当に良い子です。 という訳で学習用マシンで本格的に実行。っと、その前に電源交換しないと。 *1:PCです。念の為。

修正完了

気付いてみればどうという事のないバグでした。 今日の教訓 「assertはどんなに当たり前の事でもとにかく書いておくべし」

実験結果@二晩分

失敗でした _| ̄|○ 4x4のリバーシで後手4石勝ち。本当は8石なのに。 基本的なところで勘違いしてる可能性もあるので、とりあえず状況確認からしてみます。

リバーシでQ(λ)が動いたっぽい

あくまで“ぽい”だけですが。一晩実験してみないと正確な結果は分かりません。 んで、結構苦労しました。先手と後手が評価関数を共有しているのですが、複数回の学習のたびに毎回評価関数をロックしているとNGで、全部まとめてロックしないと上手く動かない感…

Silverthorneの話@PC Watch

http://pc.watch.impress.co.jp/docs/2007/1018/ubiq203.htm 通常電圧版が1.83GHz動作でTDP2W、低電圧版だと0.9GHz・0.6Wになるみたいですね。 スマートフォンに入れるには厳しいでしょうが、小型ノートに積んだ製品が出れば使ってみたいです。 ただ、私の場…

NehalemファミリのXeon MP@PC Watch

http://pc.watch.impress.co.jp/docs/2007/1018/kaigai394.htm 8コア+24MBキャッシュって構成らしいし、デスクトップやデュアルプロセッサ用のCPUになる事は無さそうなので、私にはあまり関係なさそうです。ただ、キャッシュの構成(の予測)が興味深かった…

Q(λ)の準備中

基礎となるデータが必要なので、通常のQ学習で複数回実験して統計を取る部分まで完成。今実行中。 適格度トレースの組み込み自体はすんなり行きそうなので、明日には完成する予定。

Matroxから久々のグラフィックカード

http://pc.watch.impress.co.jp/docs/2007/1017/matrox.htm とりあえず一枚は買う! ・・・予定ですが、解像度を見るとデュアルリンクDVIには非対応らしいです。 という訳でメインの30インチディスプレイには接続出来ないし、使えるとしたらサブディスプレイ…

Cellのサブセット搭載ノートPC

http://pc.watch.impress.co.jp/docs/2007/1015/mobile395.htm 巡回時には見落としてたっぽいんで今更記事アップ。 でも、そういうコンセプトってどーなんだろうなぁ。 ブロック図を見るとSPE×4*1+動画のエンコーダ・デコーダ+メモリI/F+PCI Express I/F…

TD(λ)+メタ強化学習は一応完成

と言うか、完成した事にします。 んで、実験結果はまぁまぁ良かったのですが、メタパラメータ手打ちの方が良い結果だったので、当面は手打ちで行く事にします。 さて、後はリバーシにTD(λ)を組み込んだら予備実験は完了。ようやくコンピュータ将棋で強化学習…

そう言えばGPW杯

参加出来るかどうかは微妙なところです。 よそ事に一切手を出さずに死ぬ気で開発すれば、プログラム自体は何とか完成しそうな感じです。が、学習する時間が無い。 まぁ、とりあえずは開発して、後は出たとこ勝負ですね。

Core 2 Extremeも2ソケットに

http://pc.watch.impress.co.jp/docs/2007/1015/ubiq202.htm 以前からちらほら話が出ていたSkulltrailですが、AMDから一年ほど遅れてようやく登場する様です。 んで、そのCPUであるCore 2 Extreme QX9775のスペックも出ていました。 3.2GHzのクアドコアでFSB…

とりあえずTD(λ)は動いてるっぽいです

λを色々変えて実験してみたら、ちゃんと予想通りの挙動になっていました。 そんな訳で明日はTD(λ)+メタ強化学習です。進行が遅れ気味なので急がないと選手権出場がピンチ。

ミスったぁ!!!

Javaでやってるんですが、toString()メソッドの定義を忘れてて出力が“Average@151ff5b”って感じに _| ̄|○ 結構時間かかったのに、ショック。

それからゲーム

らぶデス2購入。とりあえずVista Ultimate x64にインストールして動作するところまでは確認済み。

大須で買い物

とりあえず電源。学習用マシンをもうちょっと静かにしたいので購入。 んで、むしろこっちが本題のパーツの在庫チェック。 id:streakeagle:20071010:1192021236で書いたハイブリッドHDDですが、まだショップには情報が来て無いそうで入荷時期等未定。通常の2.…

おりょ?

入浴している間もプログラムを動かしてたんですが、解ける様になってました。 ひょっとしてアレかも、以前とはパラメータが違ってて、その影響で時間がかかる様になってたとか。 いずれにしろ今日はもう寝るんで、週末に調査してみます。

TD(λ)+メタ強化学習、まだ途中

というか、適格度トレースもメタ強化学習も入れる前に解けてた問題が解けなくなってました。 どうやら色々修正した際にどこか変になっていた様なので、再度見直してみます・・・が、時間が・・・・・・

640GBのフラッシュドライブのコスト

http://www.dailytech.com/640GB+PCI+Express+Flash+Drive+Costs+19000/article9219.htm id:streakeagle:20070927:1190893378で書いた、PCI Express接続のフラッシュドライブの続報です。 DailyTechによるとそのコストは$19,000、約220万円だとか。 買えね〜…

魔法言語 リリカル☆Lispがフリーに

http://blog.bugyo.tk/lyrical/2007/10/post_40.html http://lyrical.bugyo.tk/download.html とりあえずダウンロード済み。何か作りたいけど、Lisp苦手だしどうしよう(汗

TD(λ)にメタ強化学習を組み込み

id:streakeagle:20071004:1191506391で書いたTD(λ)*1では、λの設定次第で挙動が変わってきていたので、これをメタ強化学習で調整出来ないか試してみました。 結果、失敗。 原因を考えてみると、メタエージェント*2に与える報酬*3をエージェントのTD誤差の平…

ハイブリッドHDD量産出荷開始

http://pc.watch.impress.co.jp/docs/2007/1010/seagate.htm 体感速度はX38よりこっちの方が向上しそうな感じで興味津々。 スペックは5400rpmの2.5インチHDDでインタフェースはSATA*1、フラッシュメモリは256MBとか。 容量が80〜120GBって事ですから、私の用…

X38チップセット登場

http://www.watch.impress.co.jp/akiba/hotline/20071013/etc_x38.html なんだけど、1333MHz FSBのCore 2 Extremeが正式サポート、って事意外は惹かれるものが無いですね。 とりあえず様子見かなぁ。

ついカッとなってやった、でも後悔はしていない

つー訳で、昨日も書きましたがCPUとグラボ購入。Core 2 Duo E6850 & GeForce 8800 GTS。 グラボはNVIDIA・ATI共にもうすぐ新GPUが出る状況で買うのはちょっとためらったのですが、以前の環境だとゲームで支障が出てたので思い切って購入。 CPUは開発用に使う…

冷静になったところでガンダム00

OP前にちょっとだけ出てきたエクシアのプロトタイプっぽいのが気になる。 あと、それを見て主人公がガンダムは神って勘違いしたり、「俺は新世界の神になる」とか言い出しそうで期待。 ついでに、聖教新聞のCMの二個後に番組始まって、「この戦いは、神の御…

絶望した!

ガンダムヴァーチェのパイロットがツンデレ眼鏡っ娘じゃないのに絶望した!!

最近涼しくなってきて

学習用マシンのケース内温度が下がったとか、それにつられてCPUやチップセットの温度が下がってきたとか喜んでいたのですが・・・風邪をひきました _| ̄|○ 先週末にCPUとグラフィックカードを新調したのに、ほとんど触ってないですよ _| ̄|○ おまけにGPW-0…

Nehalemファミリはローエンドもメモリコントローラ有り?

http://pc.watch.impress.co.jp/docs/2007/1005/kaigai391.htm 記事の主題は「なぜCPUにGPUを統合するか」なのですが、個人的にはそれより重要なのがメモコンなので。 で、まず統合する理由ですが、単にメモコンの近くにGPUを置きたいという事だけらしいです…

適格度トレースの実装完了

ランダムウォーク問題という、一直線上に複数のポイントがあり一定時間ごとに左右どちらかにランダムに移動するというタスクで、各ポイントにいる場合に得られる報酬の期待値を計算する問題です。報酬は右端(グラフには無いですが位置20)に着いたら1、左端…