メタ強化学習にリトライ

開発日記

処理内容を思いっきりシンプルにしてみたらある程度上手くいきました。と言っても、ε*1を手で設定したのと同程度ですが。となると、複雑な事をさせようとして学習に時間がかかっている可能性もあるので、元に戻して一晩走らせてみます。 *1:ランダムに行動…

2007-09-17

Vistaの腐れバグ

ぼやき

My Documentsを開く→もう一つ開こうとする→開かないクソがああああああああああああああああああああああああ！！！！！！！！！！！！！！！！ちょっとだけVisタンが嫌いになりました。あ、ウソ。そういうドジっ娘なところも好きです。

2007-09-17

囲連星が窓の杜で紹介されていました

雑記

http://www.forest.impress.co.jp/article/2007/09/14/irensei.html これでもっとメジャーになるといいですね。ソフトも使いやすくていい感じですし。あ、囲連星のAIはまったく触ってないです（汗いずれ再開しますが、いつになることやら。

2007-09-17

Nehalemの話＠ PC Watch

コンピュータ関連

http://pc.watch.impress.co.jp/docs/2007/0916/kaigai386.htm 大体今までの噂どおりですが、大手ニュースサイトが掲載するからには、それなりに信頼出来る情報だという事でしょう。んで、気になったのはNehalemってコードネームのコアが出てこない事。ノー…

2007-09-17

■

ニュースサイトが軒並み更新してないと思ったら、今日は祝日だったんですね。え、私？出社していましたが。

2007-09-16

全面的に進行度を使用する様に修正

開発日記

600局で収束しましたよ (;´Д`) 1分かかってないですよ (;´Д`) まぁいいか、速くなったし、MinMaxと同等の時間で結果が出る様になったし。でも相変わらず正しく学習するかどうかは運任せ (;´Д`)

2007-09-16

実験結果三日分

開発日記

結局、学習は上手くいったり上手くいかなかったりでした。これは、学習率やε*1を状況に応じて変化させないとダメな感じですから、今からメタ強化学習*2を実装してみます。それと、手数ごとにパラメータを用意する方法と、初期配置・対局終了時の二つのパラ…

2007-09-16

Phenom X3(?)の噂

コンピュータ関連

http://a96sj096.cocolog-nifty.com/weblog/2007/09/amd3_5b22.html 何でそんな変なCPU出すかなぁ？欲しくなるじゃないですか。

2007-09-16

キャプチャカード購入

コンピュータ関連

主な用途がPS2（将来はPS3も）の画面をPCのディスプレイに映したいってだけなので、色々考えてMonster Xに。PV4とかってカードも出てたみたいですが、ゲーム向きじゃなさそうですし。んで、PCI Express x1スロットを空ける為にグラフィックボードを一枚交換…

2007-09-13

GeForceの父がCUDAの解説

コンピュータ関連

http://journal.mycom.co.jp/articles/2007/09/13/nvidia/003.html 概要は別のサイトで数日前にありましたが、マイコミの記事は結構詳しくて面白いです。で、話の内容はTesla*1とCUDA*2がメインだったみたいですね。この記事を読むまで知らなかったのです…

2007-09-13

実験結果とか

開発日記

上で書いた学習率等固定での実験ですが、1時間では学習が収束していない感じです。という訳で一晩実行する事に。んでもって今日は新規のコードは一行も書いてません。まぁ、たまにはこんな日もあるって事で。

2007-09-13

Quad-Core Opteron予価＆発売時期＠秋葉原

コンピュータ関連

発表関連のニュースは落ち着いて、ようやく発売の情報が入ってきました。 http://www.watch.impress.co.jp/akiba/hotline/20070915/etc_barcelonademo.html 2GHzの2350が￥49,800、1.9GHzの2347が￥40,800らしいです。いずれもUSER'S SIDE。 Xeon E5335（235…

2007-09-13

実験結果続々続くらい？

開発日記

全局面の平均二乗誤差 - 着手数あり着手数なし開放度あり 5.06 6.43 開放度なし 5.61 6.15 対局中に表れた局面の平均二乗誤差 - 着手数あり着手数なし開放度あり 1.97 2.69 開放度なし 8.89E-4 1.50 今回は着手可能数あり・開放度なしだけが学習成功。ま…

2007-09-12

SunのVictoria Falls

コンピュータ関連

http://journal.mycom.co.jp/articles/2007/09/11/hotchips2/index.html UltraSPARC T2相当のCPUを4個で4ソケット・32コア・256スレッドですか・・・そんだけあると、私がコンピュータ将棋で使っている単純な並列化では性能が出なさそうですね*1。あー、で…

2007-09-12

1時間ほど走らせた結果

開発日記

着手可能数なし・開放度ありは正しく学習していましたが、それ以外は全部変でした。ログをみてみると、まだグラフの上がり下がりが激しい（学習があまり進んでいない）状態で学習率を下げてしまっている感じです。という訳で、一局終了後のメタパラメータ…

2007-09-12

サクッと実装、スパッと動作

開発日記

てな訳で、上で書いた評価関数の改良をしてみました。コード自体はシンプルだし、メンテしやすいロジックにしてあったから特に問題なく完了。多分、風呂入ってちょこまか遊んでるうちに結果が出ると思います。あ、上の記事で進行度の計算方法を書き忘れて…

2007-09-12

続々・実験結果

開発日記

一昨日と同じ条件で強化学習をしてみました。全局面の平均二乗誤差 - 着手数あり着手数なし開放度あり 4.99 6.09 開放度なし 5.18 5.40 対局中に表れた局面の平均二乗誤差 - 着手数あり着手数なし開放度あり 7.51E-4 0.002 開放度なし 0.001 1.86 今回…

2007-09-12

そう言えばコンピュータ将棋Wiki

コンピュータ将棋

最近まったく書いてないです。言い訳すると、開発が順調だとそっちに時間かけちゃうんですよねぇ。なんで、また私が編集しだしたら行き詰ってると思って下さい。

2007-09-12

コンピュータ将棋の基礎知識 by 小宮さん

コンピュータ将棋

id:mkomiya:20070912:p4で公開中。タイトルは現代用語の基礎知識を意識してるんでしょうか。最初の項目が“ドーピング”な辺りがツボです。辞書や辞典じゃなくて、要約つきの索引って感じでしょうか。サクッと読めるので嬉しい限りです。細かい事を言うと、…

2007-09-11

Barcelona続報

コンピュータ関連

http://pc.watch.impress.co.jp/docs/2007/0911/amd2.htm 日本AMDの発表会レポートです。気になる情報は今年第4四半期に2.5GHzバージョンを出荷今後のロードマップ（ほぼ既報どおり） Quad FX用マザーのAsus L1N64-SLI WSはBIOSアップデートでBarcelona対…

2007-09-11

続・実験結果

開発日記

昨日の結果とまったく同じ条件でリトライ。全局面の平均二乗誤差 - 着手数あり着手数なし開放度あり 5.10 5.77 開放度なし 5.21 5.63 対局中に表れた局面の平均二乗誤差 - 着手数あり着手数なし開放度あり 0.001 1.97 開放度なし 0.001 1.50 今回は、着…

2007-09-10

ボットネットの計算能力はスパコン以上（ただし理論値）

コンピュータ関連

http://japan.cnet.com/news/sec/story/0,2000056024,20356125,00.htm いやそんな、信頼性低くて通信のラグも大きい分散コンピュータをスパコンと比べても・・・まぁでも、どうせなら「強制的にSETI@homeを実行する」とかで有効活用したら良いかも。

2007-09-10

id:mkomiyaさんの気になる発言

コンピュータ将棋

id:mkomiya:20070909:p6のタイトルなんですが、「来年のコンピュータ将棋選手権は、アマチュア高段者との戦いは二戦になるらしい」となっています。で、「アマチュア高段者との戦い“が”二戦になるらしい」じゃないのが気になりました。ひょっとして「他の…

2007-09-10

Quad-Core Optern性能レビュー

コンピュータ関連

http://northwood.blog60.fc2.com/blog-entry-1193.html 海外の記事しかまだ無いみたいなので、それを和訳しているサイトへリンク。ざっと見た感じ、Opteron 2GHz vs Xeon 2.33GHzでは勝ったり負けたりって感じです。まぁ、Xeonの方がクロックは高いので、…

2007-09-10

Barcelona改めQuad-Core Opteron発表

コンピュータ関連

http://pc.watch.impress.co.jp/docs/2007/0910/amd.htm 以前からの噂どおりの内容で、ネイティブクアドコア・性能面での小改良・消費電力面での大改良・従来のSocekt F採用って感じです。キャッシュはL2 512KB×4*1＋L3 2MB*2で、結構好みな構成。価格はリ…