GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-06-01から1ヶ月間の記事一覧

昨夜の実験は一応成功

先後非対称の評価関数にしたのが良かったみたいです。 んで、ソフトマックス手法ではボルツマン分布に従って手の選択確率を決めているのですが、温度というパラメータを決める必要があります。 昨夜のバージョンは温度を徐々に下げていたのですが、温度固定…

細々実装

最近は平日メインで開発してて、土日はペース遅めです。 やった事。 パラメータファイル整形プログラムのバグ取り 評価関数に先後非対称の絶対位置評価を実装 とりあえず評価項目は非対称のもののみにして一晩走らせてみます。以前の予想が当たっていればこ…

WILLCOM 03 初期設定完了

インストールしたソフトはHttpAdjustClockのみ。 [es]の時は時刻あわせはsimpleHTTPntpを使わせてもらってたのですが、03では動かなかった*1ので、ソフトを変更。 [es]ではキーロックでサスペンド状態に移行するソフトとか、ボタン一発で全角・半角を切り替…

WILLCOM 03買ってきました

昨日の話ですが。 まだほとんどカスタマイズしていないんで、土日で色々やってみます。

色々作りなおしたい

強化学習エージェント 方策をエージェントから独立させる メタ強化学習対応 報酬の扱いを修正 探索ルーチン 静止探索専用で、静止探索でもハッシュ表を使用する 今はKFEnd流の2段階だけど、1段階で深さ無制限にするかも → 性能差を計測してから ハッシュ表 …

GeForce 8800GT/9600GT値下げの噂

http://northwood.blog60.fc2.com/blog-entry-2083.html 8800 GTが$169(\18,000位)、9600 GTが$149(\16,000位)らしいので、日本での価格はそれぞれ2万・1万8千ってところでしょうか。 ニューロを動かす場合だとメモリがボトルネックになる可能性がありま…

Radeon HD 4800シリーズ解説@PC Watch

http://pc.watch.impress.co.jp/docs/2008/0626/kaigai450.htm ざくっとまとめると「演算ユニット以外はGeForceと似てる」、と。 GPGPU用途では「Stream Computing」とかって名前で開発ツールが出てるらしいんで、それの使い勝手とか色々調べてから検討。 た…

いつのまにかバグを仕込んでたらしい

パラメータのファイルへの出力結果が変でした。というか、まだ変です。修正出来ていません。 ある程度怪しい部分の目星はつけたんですが、具体的にどのコードがどう悪さをしているかは不明。明日調べます。 それから、学習がうまく行かないのは、対局条件が…

さらに間違ってた

上で書いた「評価関数の学習がちょっと変」というのは間違ってて、パラメータファイルを整形するプログラム側のバグでした。 修正するのはちょっと時間かかりそうなので、明日やります。

上で書いたバグ

後手の評価関数のパラメータをコンソールに表示して、それと先手の評価関数のパラメータをファイルに出力したものを比較しちゃっていました。 それじゃぁ「正しく」出力出来てるはずがないですね orz んでもってもう一個バグっぽいもの発見。評価関数の学習…

現実逃避ぎみにニューロの話

ノードへの入力が、結線重みがの時、ノードの出力oは下記の式ですが、シグモイド関数のαも学習させたら、α固定の場合と同じ関数近似能力を少ないノード数で実現出来ないかな、と考えています。 例えば出力層のノードの場合だと、二乗誤差をαで偏微分すると下…

うが、実験ミスってた

もう一晩かけてリトライします。

GeForce GTX 260発売開始らしい

http://www.watch.impress.co.jp/akiba/hotline/20080628/etc_nvidia.html 実売5万円前後ですから、意外と安い。6万弱まで行くかと思ってました。

うーん…

ソフトマックス手法は色々細かいバグはつぶしているんですが、それでもまだうまく動いてくれません。 というか、ちょっと実験するにも時間がかかってイマイチ開発効率がよくありません。 何とかして対処しないとまずいですね。

microSDカード到着

2GBで\1,000チョイって、一年半あまりでかなり安くなってますね。[es]の時は512MBのminiSDが\3,000位でした。 そーゆー訳で03の受け入れ準備は着々と進んでいます。今週末が待ち遠しいです。

WILLCOM 03予約

色はゴールドにしました。オヤジくさいなぁ… スタイラスはニンテンドーDS用のヤツをストラップにつける事にして購入済ですし、あとはMicroSDカードか。 こっちはネットで価格を調べて、通販で買うか店頭で買うか決める事にします。

WILLCOM 03触ってきました

細かい使い勝手は向上しているし、[es]より速くなってるし、結構良い感じでした。 イルミネーションタッチは、少し触った限りでは誤操作が多かったですが、すぐに慣れれそうです。 あとは色の選択ですね。 実物見るまではライムにしようと思ってたんですが、…

とーとつにRadeon HD 4850発表

発表記事 http://pc.watch.impress.co.jp/docs/2008/0620/amd.htm レビュー http://pc.watch.impress.co.jp/docs/2008/0620/radeon.htm 「$199で1TFLOPS!」なんだけど…カタログスペック的には格下のGeForce 9800 GTXに勝ったり敗けたり…… 何か、ビミョ─。

色々やったものの

明確な改善は見られず。 とりあえず数パターンのパラメータで一晩走らせてみますが、望み薄。

ああもうッ!

一手ごとに-0.01の報酬を与える部分をテスト用にコメントアウトしてて、それを元に戻すの忘れてました。 これじゃぁいくらやっても手数は短くなりません。アホか > 自分

ソフトマックス手法の実験結果

ダメでした。 まぁ、どっかバグッてる可能性が非常に高いので、もう一度見直してみます。

スパコンTop500にCell登場

http://pc.watch.impress.co.jp/docs/2008/0619/top500.htm 以前書いたPowerXCell 8i(倍精度演算をサポートしたCell)を多数搭載しているそうです。 こうなるとNVIDIAやATIは黙っちゃいられないでしょうね。GPGPUで高性能のスパコンもそのうち登場してくれ…

GeForce 9800 GTX+が出るらしい

http://journal.mycom.co.jp/news/2008/06/19/027/index.html スペック的には9800 GTXのオーバークロック版ですが、結構安くなりそうですね。 てか、全く噂の無かった新モデルだと思うので、出たこと自体が意外。

あーなんか体調悪いんで

今日はもう終了。 んで、開発用マシンには数通りのパラメータで一晩実験してて貰います。ガンバレ。

昨日のおかしかったのは

私の頭でしたorz 誰かデバッグして下さい。いやマジで。 んで、ソフトマックス手法でうまく学習してくれなかったのは、Boltzmann分布にしたがって手を選択する所で、選択したつもりの手と実際の手が1つずれていたのが原因でした。 さて、もうちょっとデバッ…

WILLCOM 03は6/27発売

http://www.willcom-inc.com/ja/corporate/press/2008/06/18/index.html?ref=rdf て事は、6/20から店頭デモが始まるはずなんで、いっぺん見てきます。 買うかどうかは未定。スタイラス内蔵出来ないのがなぁ…

サイコミュが近日発売

http://www.watch.impress.co.jp/akiba/hotline/20080621/etc_brain.html もちろん商品名は違いますが。 ジョイスティックやキーボードの置き換えが可能だそうなので、使いこなせれれば便利そうですね。 んで、お値段\24,800。 無理すれば変えるけど、そうす…

ソフトマックス手法の実装完了

…のはずが、挙動がどうもおかしい…… とりあえずアサーション有効にして一晩走らせてみます。

GeForce GTX 280/260続報

http://pc.watch.impress.co.jp/docs/2008/0617/kaigai446.htm SFU(複雑な演算用のユニット)は4つのStreaming Processor(スカラ演算器)で共有する構成で、GeForce 8800/9800と同じでした。 それからもう一つ。「一部推定」と注釈付の図ではありますが、…

明日からのおおざっぱな予定

自己対戦でのBonanza Methodはやりません。強化学習で行きます。今まで多少なりとも強化学習での経験を得られたんで、それを捨てるのはもったいないですから。 まずはソフトマックス手法*1を試してみて、後は出たとこ勝負。 メタ強化学習は出来るだけ早期に…