GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-09-01から1ヶ月間の記事一覧

メタ強化学習にリトライ

処理内容を思いっきりシンプルにしてみたらある程度上手くいきました。 と言っても、ε*1を手で設定したのと同程度ですが。 となると、複雑な事をさせようとして学習に時間がかかっている可能性もあるので、元に戻して一晩走らせてみます。 *1:ランダムに行動…

Vistaの腐れバグ

My Documentsを開く→もう一つ開こうとする→開かない クソがああああああああああああああああああああああああ!!!!!!!!!!!!!!!! ちょっとだけVisタンが嫌いになりました。 あ、ウソ。そういうドジっ娘なところも好きです。

囲連星が窓の杜で紹介されていました

http://www.forest.impress.co.jp/article/2007/09/14/irensei.html これでもっとメジャーになるといいですね。ソフトも使いやすくていい感じですし。 あ、囲連星のAIはまったく触ってないです(汗 いずれ再開しますが、いつになることやら。

Nehalemの話 @ PC Watch

http://pc.watch.impress.co.jp/docs/2007/0916/kaigai386.htm 大体今までの噂どおりですが、大手ニュースサイトが掲載するからには、それなりに信頼出来る情報だという事でしょう。 んで、気になったのはNehalemってコードネームのコアが出てこない事。ノー…

ニュースサイトが軒並み更新してないと思ったら、今日は祝日だったんですね。 え、私? 出社していましたが。

全面的に進行度を使用する様に修正

600局で収束しましたよ (;´Д`) 1分かかってないですよ (;´Д`) まぁいいか、速くなったし、MinMaxと同等の時間で結果が出る様になったし。 でも相変わらず正しく学習するかどうかは運任せ (;´Д`)

実験結果 三日分

結局、学習は上手くいったり上手くいかなかったりでした。 これは、学習率やε*1を状況に応じて変化させないとダメな感じですから、今からメタ強化学習*2を実装してみます。 それと、手数ごとにパラメータを用意する方法と、初期配置・対局終了時の二つのパラ…

Phenom X3(?)の噂

http://a96sj096.cocolog-nifty.com/weblog/2007/09/amd3_5b22.html 何でそんな変なCPU出すかなぁ? 欲しくなるじゃないですか。

キャプチャカード購入

主な用途がPS2(将来はPS3も)の画面をPCのディスプレイに映したいってだけなので、色々考えてMonster Xに。PV4とかってカードも出てたみたいですが、ゲーム向きじゃなさそうですし。 んで、PCI Express x1スロットを空ける為にグラフィックボードを一枚交換…

GeForceの父がCUDAの解説

http://journal.mycom.co.jp/articles/2007/09/13/nvidia/003.html 概要は別のサイトで数日前にありましたが、マイコミの記事は結構詳しくて面白いです。 で、話の内容はTesla*1とCUDA*2がメインだったみたいですね。 この記事を読むまで知らなかったのです…

実験結果とか

上で書いた学習率等固定での実験ですが、1時間では学習が収束していない感じです。 という訳で一晩実行する事に。んでもって今日は新規のコードは一行も書いてません。 まぁ、たまにはこんな日もあるって事で。

Quad-Core Opteron予価&発売時期 @ 秋葉原

発表関連のニュースは落ち着いて、ようやく発売の情報が入ってきました。 http://www.watch.impress.co.jp/akiba/hotline/20070915/etc_barcelonademo.html 2GHzの2350が¥49,800、1.9GHzの2347が¥40,800らしいです。いずれもUSER'S SIDE。 Xeon E5335(235…

実験結果 続々続くらい?

全局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 5.06 6.43 開放度なし 5.61 6.15 対局中に表れた局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 1.97 2.69 開放度なし 8.89E-4 1.50 今回は着手可能数あり・開放度なしだけが学習成功。ま…

SunのVictoria Falls

http://journal.mycom.co.jp/articles/2007/09/11/hotchips2/index.html UltraSPARC T2相当のCPUを4個で4ソケット・32コア・256スレッドですか・・・ そんだけあると、私がコンピュータ将棋で使っている単純な並列化では性能が出なさそうですね*1。 あー、で…

1時間ほど走らせた結果

着手可能数なし・開放度ありは正しく学習していましたが、それ以外は全部変でした。 ログをみてみると、まだグラフの上がり下がりが激しい(学習があまり進んでいない)状態で学習率を下げてしまっている感じです。 という訳で、一局終了後のメタパラメータ…

サクッと実装、スパッと動作

てな訳で、上で書いた評価関数の改良をしてみました。 コード自体はシンプルだし、メンテしやすいロジックにしてあったから特に問題なく完了。 多分、風呂入ってちょこまか遊んでるうちに結果が出ると思います。 あ、上の記事で進行度の計算方法を書き忘れて…

続々・実験結果

一昨日と同じ条件で強化学習をしてみました。 全局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 4.99 6.09 開放度なし 5.18 5.40 対局中に表れた局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 7.51E-4 0.002 開放度なし 0.001 1.86 今回…

そう言えばコンピュータ将棋Wiki

最近まったく書いてないです。 言い訳すると、開発が順調だとそっちに時間かけちゃうんですよねぇ。 なんで、また私が編集しだしたら行き詰ってると思って下さい。

コンピュータ将棋の基礎知識 by 小宮さん

id:mkomiya:20070912:p4で公開中。タイトルは現代用語の基礎知識を意識してるんでしょうか。 最初の項目が“ドーピング”な辺りがツボです。 辞書や辞典じゃなくて、要約つきの索引って感じでしょうか。サクッと読めるので嬉しい限りです。 細かい事を言うと、…

Barcelona続報

http://pc.watch.impress.co.jp/docs/2007/0911/amd2.htm 日本AMDの発表会レポートです。 気になる情報は 今年第4四半期に2.5GHzバージョンを出荷 今後のロードマップ(ほぼ既報どおり) Quad FX用マザーのAsus L1N64-SLI WSはBIOSアップデートでBarcelona対…

続・実験結果

昨日の結果とまったく同じ条件でリトライ。 全局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 5.10 5.77 開放度なし 5.21 5.63 対局中に表れた局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 0.001 1.97 開放度なし 0.001 1.50 今回は、着…

ボットネットの計算能力はスパコン以上(ただし理論値)

http://japan.cnet.com/news/sec/story/0,2000056024,20356125,00.htm いやそんな、信頼性低くて通信のラグも大きい分散コンピュータをスパコンと比べても・・・ まぁでも、どうせなら「強制的にSETI@homeを実行する」とかで有効活用したら良いかも。

id:mkomiyaさんの気になる発言

id:mkomiya:20070909:p6のタイトルなんですが、「来年のコンピュータ将棋選手権は、アマチュア高段者との戦いは二戦になるらしい」となっています。 で、「アマチュア高段者との戦い“が”二戦になるらしい」じゃないのが気になりました。 ひょっとして「他の…

Quad-Core Optern性能レビュー

http://northwood.blog60.fc2.com/blog-entry-1193.html 海外の記事しかまだ無いみたいなので、それを和訳しているサイトへリンク。 ざっと見た感じ、Opteron 2GHz vs Xeon 2.33GHzでは勝ったり負けたりって感じです。 まぁ、Xeonの方がクロックは高いので、…

Barcelona改めQuad-Core Opteron発表

http://pc.watch.impress.co.jp/docs/2007/0910/amd.htm 以前からの噂どおりの内容で、ネイティブクアドコア・性能面での小改良・消費電力面での大改良・従来のSocekt F採用って感じです。 キャッシュはL2 512KB×4*1+L3 2MB*2で、結構好みな構成。 価格はリ…

実験結果メモ

昨日実装した評価関数の小細工は効果があった様で、4パターン共ちゃんと学習していました。 まず、例によって強化学習バージョンの平均二乗誤差。全局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 5.29 5.29 開放度なし 5.14 5.42 対局中に表れた局…

今日は残業で遅くなったので簡易更新。多分明日も同じ。

水冷メンテ&i-RAM追加

上の開発日記と順序が逆になりましたが、学習用マシンの水冷のメンテナンス。 マニュアルによると月一回メンテナンスが必要らしいです。 と言っても、冷却液を補充してポンプの動作や冷却具合を確認するだけですが。 あと、一緒にi-RAM増設。1GB×4枚で4GB分…

リバーシの評価関数をちょっとだけ改良

今日のコメント欄で書いた「評価項目を増やした際の過剰な学習への対策」を実装しました。 まず、今までの実装だと学習の流れは以下の様になります。 評価値を計算する 評価値と目標値から誤差を計算する 評価値計算で使用した全パラメータに対して繰り返し …

方針変更を反映

リバーシ関連 盤面の実装 評価関数の実装(あまり複雑な事はしない) 石の位置・手番による評価 手数と石の数による評価 着手可能数 開放度 この後の進展次第で追加 MinMaxの実装 探索値との平均二乗誤差の計算 メタ強化学習 αβの実装 必勝読みの実装 適格度…