GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-09-01から1ヶ月間の記事一覧

実験結果

id:streakeagle:20070912:1189599587で書いた進行度を用いた評価関数ですが、どうもこの改良をする前の方が6x6のリバーシに向いているみたいです。試しに1プロセスだけ動作させていた旧バージョンの方が良い結果でした。 原因を予想してみると、6x6のリバー…

今度はNANDフラッシュメモリ搭載のストレージ

http://pc.watch.impress.co.jp/docs/2007/0927/demo03.htm Fusion-ioというメーカのioDrive。PCI Express x4搭載のカードで、容量は40GB〜640GB。 「デモでは4KBのランダムアクセス読み出し速度で400MB/sec弱を発揮する結果を紹介。」と書いてあるので、PCI…

Nehalem予想記事@PC Watch

http://pc.watch.impress.co.jp/docs/2007/0927/kaigai389.htm あくまで断片的な情報からの予測でしょうが、読み物としては面白いと思います。 Penryn*1とNehalemのダイ写真からコアの大きさの比率を1:1.5と予測していますが、そのうち5%前後はSMT*2による増…

細々した改良

なんだかんだで色々やりましたが、細かい事だし読んでも面白く無さそうなのでパス。 大きい改良は評価関数専用のメタ強化学習エージェントをを作って、平均二乗誤差が最小になる様に学習率の調整をさせようとしました。 が、これは失敗。色々原因は考えられ…

実験結果

えー、6x6のリバーシですが、石差が+30〜-30まで激しく変化していました。って、失敗してますがな。 一部のメタパラメータを手打ちしているのですが、その中の一つが過激な設定すぎた様です。 という訳で、ちょっと大人し目の値にしてリトライしてみます。

DreamSceneには失望した

Windows Vista Ultimate限定で、動画をデスクトップの背景に出来るDreamSceneが公開されていたので試してみました。 で、「マルチディスプレイだと動作しないよ」ってメッセージが・・・ もういいです。バージョンアップで対応するのにも期待しない。どうせ…

上の記事の補足

というか、訂正。 本来はメタ強化学習一発で解決したかったんですが、それを何とかしようとしてるうちにメタパラメータ調整の勘所が分かってきました。 これは、メタメタパラメータ*1をメタ強化学習で調整したかったのですが、色々工夫しているうちにメタメ…

今日までの分を反映

リバーシ関連 盤面の実装 評価関数の実装(あまり複雑な事はしない) 石の位置・手番による評価 手数と石の数による評価 着手可能数 開放度 この後の進展次第で追加 MinMaxの実装 探索値との平均二乗誤差の計算 メタ強化学習 αβの実装 必勝読みの実装 適格度…

4x4リバーシは終了(予定)

とりあえずある程度の形は出来たので。学習の途中経過はこんな感じです。 解明結果である後手8石差前後で推移しつつそれより良い手が無いか探す、という結果になっています。 さっき10分ほど動かした結果だと、同条件で動かした4プロセス全部がきちんと学習…

またもやC言語の派生版

http://pc.watch.impress.co.jp/docs/2007/0925/idf10.htm 今度はIntelのCtだとか。NVIDIAのCgを真似た名前でしょうかね。 で、用途はマルチコアCPU向けの科学技術演算みたいです。 コンパイル手順はCtで書いたソースを専用コンパイラでOpenMP*1対応のC++ソ…

Intelのノート向けクアドコアCPUは来年第3四半期

http://pc.watch.impress.co.jp/docs/2007/0925/ubiq198.htm スペックはコアクロック3.06GHz、FSB 1066MHz、L2 6MB*1でTDP 45Wだとか。 今の視点で見ると魅力的ですが、もうちょっと待てばNehalemが出てくる事を考えると微妙な位置づけ。 てか、デスクトップ…

Athlon 64 X2 5000+ Black Edition

http://pc.watch.impress.co.jp/docs/2007/0925/amd.htm 倍率変更可能って事ですから、2.8GHzにオーバークロックして使うのがデフォになるんでしょうか? 当たりの個体じゃなくても3.2GHzを狙えるというのならかなり面白そうですが・・・私には用途が無いで…

さらに拡張

まず、パラメータの類とそれが影響する範囲をまとめると、こうなります。メタメタパラメータ ↓ 動作に影響する メタエージェント ↓ 調整する メタパラメータ ↓ 動作に影響する エージェント ↓ 調整する パラメータ ↓ 動作に影響する 評価関数 で、今まではメ…

さっきの実験結果

4プロセス中正しく学習したのは2つ。さっきのとあわせると、成功率は75%で変わらず。

細々とした改良

まず、メタエージェント*1が学習する間隔が今までは100局ごとだったのを、一局終わるごとに0.02の確率で学習する様に変更。 これは、先手のメタエージェントと後手のメタエージェントが同じタイミングで学習すると不具合があるかもしれないと考えたからです…

実験結果

4x4のリバーシをメタ強化学習ありの強化学習で4プロセス走らせてみた結果、3つは正しく8石差と学習し、1つは9石差でした。全部同じ条件での実験なので、乱数の影響で結果が変わっているのでしょう。 で、ログを見てみると先手と後手が「もうこれ位の石差で手…

IDFまとめ記事@マイコミジャーナル

http://journal.mycom.co.jp/articles/2007/09/24/idf01/index.html 新CPUのPenrynファミリ・X38チップセットやデュアルCPUのSkullTrailから、来年発売予定のNehalemまで順序良くまとまっています。 といっても、DDR3世代のFB-DIMM2が出てくる様子が無い、と…

色々やったので更新

リバーシ関連 盤面の実装 評価関数の実装(あまり複雑な事はしない) 石の位置・手番による評価 手数と石の数による評価 着手可能数 開放度 この後の進展次第で追加 MinMaxの実装 探索値との平均二乗誤差の計算 メタ強化学習 αβの実装 必勝読みの実装 適格度…

非グリーディー行動選択時の動作を修正

今までは全ての手を等しい確率で選択するという処理だったのですが、Boltzmann分布を使って評価値の高い手ほど高確率で選ぶ様に変更しました。 Boltzmann分布には温度というメタパラメータがあるのですが、それもメタ強化学習で修正可能に。 今一回動かした…

αβの実装完了

完全読み8手 必勝読み無し それ以外はαβ5手で指し手決定 だと上手くいきました。 ただ、4x4のリバーシで最初から4石置いてあるので、αβで先読みするのは最初の4手だけ。これじゃぁ上手くいって当然です。 で、試しに完全読みを6手に減らしてみると、こんな感…

リバーシにメタ強化学習実装完了

結果は・・・微妙。 前よりは良いけど、4x4のリバーシですら学習がちゃんと進むかどうかはいまだに運任せ。 もうちょっと修正しないとダメだけど、方針が決まらないので少し考えてみます。 やっぱ、αβとか必勝読みとかを実装してからじゃないと、上手く動か…

メタ強化学習の第一歩は完成

n本腕バンディット問題*1でテスト中。 複数のメタパラメータ*2を同時に調整させてもちゃんと動いたし、非定常環境*3でも動作。おおむね上手くいっいます。 これ以上自分で考えた拡張をしても改悪にしかならなさそうなので、このままリバーシにメタ強化学習を…

メタ強化学習にリトライ

http://www.cns.atr.jp/cnb/papers/pdf/Schweeighofer2003nn.pdfの論文をほぼそのまま実装。n本腕バンディット問題はちゃんと学習してくれました。 が、細かい所で色々困った事があります。さて、どうするか。 とりあえず無視してリバーシにメタ強化学習を使…

IDF関係の情報

Penrynファミリは11月12日投入 http://pc.watch.impress.co.jp/docs/2007/0920/idf02.htm ただし、デスクトップ向けはハイエンドのCore 2 Extreme QX9650のみ。それ以外のモデルは来年1月の予定だとか。 QX9650は3GHz動作のクアドコア、FSBは1333MHz、L2 6MB…

どっか根本的に勘違いしている感じです

てな訳で、まずは論文を読んで、その後はソースを一から作り直します。 現在のソースはn本腕バンディット問題をεグリーディー方策で解く場合にしか使えないし、色々ゴチャゴチャやりすぎてメンテするのも大変なので、思い切って破棄。 今週中には・・・終わ…

IDF関係の情報色々

FASN8対抗のSkulltrail http://pc.watch.impress.co.jp/docs/2007/0919/idf01.htm XeonのCPU・チップセットをほぼそのまま流用したゲーマー向けPCですが、NVIDIAのSLIが動作する構成でデモされていた模様。 Nehalemの初期サンプル http://journal.mycom.co.j…

不調

細々した修正を色々してみるものの、メタ強化学習は上手く動いてくれません。 で、コードをいじるのは一旦中断して、ソースを印刷して見直す&以前見つけた論文を読む事にします。

Intelが物理演算エンジンメーカを買収

http://pc.watch.impress.co.jp/docs/2007/0918/intel.htm まさかLarrabee*1は物理演算専用になります、なんて事は・・・あったらやだなぁ。 *1:Intelが開発中の、x86ベースの高並列プロセッサ

Phenom X3正式にロードマップにロードマップに登場

http://pc.watch.impress.co.jp/docs/2007/0918/amd.htm デュアルコアより高性能でクアドコアより安いってプロセッサの需要がどの程度あるかは不明ですが、値段次第では売れ筋になるでしょう。

Nehalemのメモリーコントローラ解説記事 @ PC Watch

http://pc.watch.impress.co.jp/docs/2007/0918/kaigai387.htm 要するに「Nehalemではメモリの容量を確保する為に3チャネルのDDR3にしました」「FB-DIMMを使う現在のチップセットと同程度の容量を確保出来ます」「ただし、容量を増やす為には速度面で制約が…