2007-09-01から1ヶ月間の記事一覧
処理内容を思いっきりシンプルにしてみたらある程度上手くいきました。 と言っても、ε*1を手で設定したのと同程度ですが。 となると、複雑な事をさせようとして学習に時間がかかっている可能性もあるので、元に戻して一晩走らせてみます。 *1:ランダムに行動…
My Documentsを開く→もう一つ開こうとする→開かない クソがああああああああああああああああああああああああ!!!!!!!!!!!!!!!! ちょっとだけVisタンが嫌いになりました。 あ、ウソ。そういうドジっ娘なところも好きです。
http://www.forest.impress.co.jp/article/2007/09/14/irensei.html これでもっとメジャーになるといいですね。ソフトも使いやすくていい感じですし。 あ、囲連星のAIはまったく触ってないです(汗 いずれ再開しますが、いつになることやら。
http://pc.watch.impress.co.jp/docs/2007/0916/kaigai386.htm 大体今までの噂どおりですが、大手ニュースサイトが掲載するからには、それなりに信頼出来る情報だという事でしょう。 んで、気になったのはNehalemってコードネームのコアが出てこない事。ノー…
ニュースサイトが軒並み更新してないと思ったら、今日は祝日だったんですね。 え、私? 出社していましたが。
600局で収束しましたよ (;´Д`) 1分かかってないですよ (;´Д`) まぁいいか、速くなったし、MinMaxと同等の時間で結果が出る様になったし。 でも相変わらず正しく学習するかどうかは運任せ (;´Д`)
結局、学習は上手くいったり上手くいかなかったりでした。 これは、学習率やε*1を状況に応じて変化させないとダメな感じですから、今からメタ強化学習*2を実装してみます。 それと、手数ごとにパラメータを用意する方法と、初期配置・対局終了時の二つのパラ…
http://a96sj096.cocolog-nifty.com/weblog/2007/09/amd3_5b22.html 何でそんな変なCPU出すかなぁ? 欲しくなるじゃないですか。
主な用途がPS2(将来はPS3も)の画面をPCのディスプレイに映したいってだけなので、色々考えてMonster Xに。PV4とかってカードも出てたみたいですが、ゲーム向きじゃなさそうですし。 んで、PCI Express x1スロットを空ける為にグラフィックボードを一枚交換…
http://journal.mycom.co.jp/articles/2007/09/13/nvidia/003.html 概要は別のサイトで数日前にありましたが、マイコミの記事は結構詳しくて面白いです。 で、話の内容はTesla*1とCUDA*2がメインだったみたいですね。 この記事を読むまで知らなかったのです…
上で書いた学習率等固定での実験ですが、1時間では学習が収束していない感じです。 という訳で一晩実行する事に。んでもって今日は新規のコードは一行も書いてません。 まぁ、たまにはこんな日もあるって事で。
発表関連のニュースは落ち着いて、ようやく発売の情報が入ってきました。 http://www.watch.impress.co.jp/akiba/hotline/20070915/etc_barcelonademo.html 2GHzの2350が¥49,800、1.9GHzの2347が¥40,800らしいです。いずれもUSER'S SIDE。 Xeon E5335(235…
全局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 5.06 6.43 開放度なし 5.61 6.15 対局中に表れた局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 1.97 2.69 開放度なし 8.89E-4 1.50 今回は着手可能数あり・開放度なしだけが学習成功。ま…
http://journal.mycom.co.jp/articles/2007/09/11/hotchips2/index.html UltraSPARC T2相当のCPUを4個で4ソケット・32コア・256スレッドですか・・・ そんだけあると、私がコンピュータ将棋で使っている単純な並列化では性能が出なさそうですね*1。 あー、で…
着手可能数なし・開放度ありは正しく学習していましたが、それ以外は全部変でした。 ログをみてみると、まだグラフの上がり下がりが激しい(学習があまり進んでいない)状態で学習率を下げてしまっている感じです。 という訳で、一局終了後のメタパラメータ…
てな訳で、上で書いた評価関数の改良をしてみました。 コード自体はシンプルだし、メンテしやすいロジックにしてあったから特に問題なく完了。 多分、風呂入ってちょこまか遊んでるうちに結果が出ると思います。 あ、上の記事で進行度の計算方法を書き忘れて…
一昨日と同じ条件で強化学習をしてみました。 全局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 4.99 6.09 開放度なし 5.18 5.40 対局中に表れた局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 7.51E-4 0.002 開放度なし 0.001 1.86 今回…
最近まったく書いてないです。 言い訳すると、開発が順調だとそっちに時間かけちゃうんですよねぇ。 なんで、また私が編集しだしたら行き詰ってると思って下さい。
id:mkomiya:20070912:p4で公開中。タイトルは現代用語の基礎知識を意識してるんでしょうか。 最初の項目が“ドーピング”な辺りがツボです。 辞書や辞典じゃなくて、要約つきの索引って感じでしょうか。サクッと読めるので嬉しい限りです。 細かい事を言うと、…
http://pc.watch.impress.co.jp/docs/2007/0911/amd2.htm 日本AMDの発表会レポートです。 気になる情報は 今年第4四半期に2.5GHzバージョンを出荷 今後のロードマップ(ほぼ既報どおり) Quad FX用マザーのAsus L1N64-SLI WSはBIOSアップデートでBarcelona対…
昨日の結果とまったく同じ条件でリトライ。 全局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 5.10 5.77 開放度なし 5.21 5.63 対局中に表れた局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 0.001 1.97 開放度なし 0.001 1.50 今回は、着…
http://japan.cnet.com/news/sec/story/0,2000056024,20356125,00.htm いやそんな、信頼性低くて通信のラグも大きい分散コンピュータをスパコンと比べても・・・ まぁでも、どうせなら「強制的にSETI@homeを実行する」とかで有効活用したら良いかも。
id:mkomiya:20070909:p6のタイトルなんですが、「来年のコンピュータ将棋選手権は、アマチュア高段者との戦いは二戦になるらしい」となっています。 で、「アマチュア高段者との戦い“が”二戦になるらしい」じゃないのが気になりました。 ひょっとして「他の…
http://northwood.blog60.fc2.com/blog-entry-1193.html 海外の記事しかまだ無いみたいなので、それを和訳しているサイトへリンク。 ざっと見た感じ、Opteron 2GHz vs Xeon 2.33GHzでは勝ったり負けたりって感じです。 まぁ、Xeonの方がクロックは高いので、…
http://pc.watch.impress.co.jp/docs/2007/0910/amd.htm 以前からの噂どおりの内容で、ネイティブクアドコア・性能面での小改良・消費電力面での大改良・従来のSocekt F採用って感じです。 キャッシュはL2 512KB×4*1+L3 2MB*2で、結構好みな構成。 価格はリ…
昨日実装した評価関数の小細工は効果があった様で、4パターン共ちゃんと学習していました。 まず、例によって強化学習バージョンの平均二乗誤差。全局面の平均二乗誤差 - 着手数あり 着手数なし 開放度あり 5.29 5.29 開放度なし 5.14 5.42 対局中に表れた局…
今日は残業で遅くなったので簡易更新。多分明日も同じ。
上の開発日記と順序が逆になりましたが、学習用マシンの水冷のメンテナンス。 マニュアルによると月一回メンテナンスが必要らしいです。 と言っても、冷却液を補充してポンプの動作や冷却具合を確認するだけですが。 あと、一緒にi-RAM増設。1GB×4枚で4GB分…
今日のコメント欄で書いた「評価項目を増やした際の過剰な学習への対策」を実装しました。 まず、今までの実装だと学習の流れは以下の様になります。 評価値を計算する 評価値と目標値から誤差を計算する 評価値計算で使用した全パラメータに対して繰り返し …
リバーシ関連 盤面の実装 評価関数の実装(あまり複雑な事はしない) 石の位置・手番による評価 手数と石の数による評価 着手可能数 開放度 この後の進展次第で追加 MinMaxの実装 探索値との平均二乗誤差の計算 メタ強化学習 αβの実装 必勝読みの実装 適格度…