GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-08-01から1ヶ月間の記事一覧

コメントに関するお知らせ

えーっと、これだけは見えるところに書いとかないと。 私はスパム以外はコメントを削除しない方針だったのですが、石ころ・・・じゃなかった、いしざき(自称)の発言は目に余るものがあるので、これからは私の判断で削除する方針に転換します(削除しない事…

激しく不快な内容が多量に含まれています

最近コメントが多い某氏の事です。 あ、ちなみにいしざきさんは読む必要ありません。どうせ理解出来ませんから。

AMDが先回りしてSSE5の仕様決定

http://pc.watch.impress.co.jp/docs/2007/0830/amd2.htm どうせなら“3D Now! Extreme”みたいな名前にして欲しかったなぁ。 内容的には・・・微妙。あれば便利なんだろうけど、SSE5を使う為にわざわざアセンブリコードを書く気にはなりませんね。

評価関数のエージェントへの組み込み完了

とりあえず4×4のリバーシでは学習に成功。 結果はテーブル形式よりちょっと悪い結果だけど、学習速度に関しては比較するまでも無く速いです。 んで、現在6×6で学習中。Wikipediaによれば16対20で後手の勝ちになるらしいですが、ちゃんとそういう結果になるで…

Core 2 Extreme モバイルバージョンの載るMini-ITXマザー発売

http://www.watch.impress.co.jp/akiba/hotline/20070901/etc_msi.html しかもPCI Express x16とPCIが各1本。なんか、かなり魅力的。 ただ、マザーが4万6千円でCPUが多分10万前後。気軽に買える値段じゃないですねぇ。 あ、後ケースか。Mini-ITXで拡張スロ…

欧州最大のスパコン

RSSリーダ経由で知ったのですが、スペインのバルセロナにあるみたいですね。 で、BarcelonaコアのOpteronにアップグレードしたら楽しいなぁ、と思ってたんですが、IBMのPOWERらしいです。残念。

評価関数の学習部分が完成

ざっくりテストしてみましたが、多分正しいはず。ただ、まだ強化学習エージェントには組み込んでないので、本格的に動き出すのは明日から。 他に、リバーシの局面クラスと強化学習のタスクを結ぶ部分を実装。テーブル形式*1の行動価値関数を使うバージョンは…

あう、相変わらず長い

なんか、説明しようとすると冗長になる気が。何とかせねば。

リバーシ用評価関数

初期化・評価する部分は実装完了、明日は学習部分を作る予定*1。以上。 ・・・だとネタが無いので、ちょっと実装上の工夫を。 まず、学習を実装しようとすると、「制御構造*2は同じで、その中の処理だけ変えたい」と言う事があります。 例えば下のコードはリ…

バンダイの昆虫ロボ

http://plusd.itmedia.co.jp/lifestyle/articles/0708/28/news037.html 赤いやつを買って「3倍速い!」とか、黒く塗って「黒い三連星ゴキ(ry」とかしてみたいですね。 ところでこのコメント、やけにゴキブリに好意的なんですが。 その上でクールな動きや…

DVD-ROMドライブが当たりました!

つ 【PC Watch】パイオニア製DVDドライブのピックアップに不具合。 ・・・当たりました _| ̄|○

細々と更新

リバーシの盤面の実装 リバーシ用の評価関数の実装(あまり複雑な事はしない) 石の位置・手番による評価 手数と石の数による評価 αβの実装 リバーシの必勝読みの実装 ← ここまでの目標 9月2日 将棋で使う為に強化学習関連のクラスをC++に移植 詰め将棋の実…

リバーシのボードを実装完了

機能としてはこれだけ。 盤面・手番の表現 盤のサイズは可変 合法手の列挙(パス含む) 石を置き、裏返す 終局の判定(石で埋まる OR 二連続パス) 先手・後手の石の数の差分計算 これだけなんだけど、なんか妙に時間かかったなぁ。 やっぱアレか、頭の中に…

Intel Tolapaiの詳細

http://pc.watch.impress.co.jp/docs/2007/0827/kaigai382.htm Pentium M(Dothanコア?)ベースのx86コアにチップセット・暗号化チップ等を組み合わせたSoCで、大体噂どおりの内容。ただし、グラフィック機能は内蔵しないそうです。 一般向けの用途だとハイ…

バックアップが終わらない

OSをVistaにして以降ろくにバックアップ取ってなかったんですが、ぼちぼち消えると困るソースが出てきたんでバックアップ中。 ソフトはDisk Mirroring Toolっつーのを使ってます。 んで、ほぼ完全にミラーリングしてる状態なんで、もう時間がかかってかかっ…

将棋用の強化学習を実装するまで

リバーシの盤面の実装 リバーシの必勝読みの実装 リバーシ用の評価関数の実装(あまり複雑な事はしない) ← ここまでの目標 9月2日 将棋で使う為に強化学習関連のクラスをC++に移植 詰め将棋の実装 将棋用の評価関数の実装 ← ここまでの目標9月中 絶対位置に…

リーチ判定ルーチン(仮称)実装完了

将棋で言うと、一手詰めと頓死判定が出来る様になったレベルです。 んで、結果。収束するまでの対局数が約7万→約3万5千に半減。もうちょっと減ると思ってたけど、見込みが甘かったですねぇ。バグかもしれないんで、も一回ソースを見てみます。 けどまぁ、こ…

勝率・行動価値の出力完了

・・・約3万回対局しても収束してないです。 やっぱあれか、リーチしてるのにそっぽに打ったり、相手のリーチを止めなかったりするから遅い? リーチかどうかだけ見て手を決めるっていう、将棋で言う詰め将棋ルーチンみたいなのが必要だろうか。

HTML化コードの移植完了

ざっと見てみると、割とちゃんと学習してるっぽい。 んで、ちょっと時間かけて動かしてみます。

三目並べのマルチスレッドは大体完成

ただ、学習の様子をテキストで表示するだけなので、ちゃんと学習してるかどうかは不明。 てな訳で、今度はログの出力関係を作らないと。 とりあえずは、以前作ったノードと価値関数のHTML化コードを移植して、あとは勝率や初期配置での行動価値の出力ですね。

給料入ったら買いたいもの

静かな電源 Vista x64で動くプリンタ ポータブルオーディオプレイヤー プリンタ対応状況 Canon インクジェット http://cweb.canon.jp/e-support/qa/1055/app/servlet/qadoc?qa=043685 〃 レーザー http://cweb.canon.jp/e-support/qa/1055/app/servlet/qadoc…

しまった、見落としてた(汗

http://d.hatena.ne.jp/mkomiya/20070822/p4で指摘されてた、64コアの組み込みCPUの話。 http://www.atmarkit.co.jp/news/200708/21/tile.html なんか、すごく面白そう。どっかのゲーム機が採用しないかなぁ。5万以下なら買う! 8×8で64って事は、ちょうどオ…

8/20の日記の補足

id:streakeagle:20070820:1187623564で書いた三目並べのマルチスレッドの件です。 http://d.hatena.ne.jp/Gasyou/20070820/1187623564 GA将!さんが、三目並べを並列処理で試しているらしい。 強化学習かな。 http://d.hatena.ne.jp/mkomiya/20070822/p1 強…

IntelのLarrabeeがRambusメモリを採用?

http://pc.watch.impress.co.jp/docs/2007/0821/kaigai381.htm PS3(というかCell BE)が使用しているXDR DRAMをLarrabeeも使用するかも、という話。 スループット重視のプロセッサにRambusのメモリですか、個人的には結構好みな構成。 しかし、本命はJEDEC…

小手先の修正して様子見

java.lang.Object.wait(long)を使えば、変なタイミングでロックしても大丈夫(かもしれない)ので、それで一晩様子見。

そーいや今日の会社帰りにCD買った

TVアニメ「涼宮ハルヒの憂鬱」 キャラクターソング Vol.2 長門有希アーティスト: 長門有希(茅原実里),畑亜貴,上松範康,星野純一,安藤高弘,myu出版社/メーカー: ランティス発売日: 2006/07/05メディア: CD購入: 2人 クリック: 661回この商品を含むブログ (349…

少し、頭冷やそうよ

ロック周りの設計間違えた。死にたい _| ̄|○ 今日はもう時間がヤヴァイので、明日やります。

三目並べを実装中

いらん事考えてマルチスレッド化したら苦労しまくり。 でもシングルスレッドでやるともっとグチャグチャになるし、何とか完成させないと・・・

メタ強化学習は一旦中断

で、以前作った三目並べのソースを引っ張ってきて強化学習で使える様にちょっと修正。 にしても、自分が書いたものであっても以前のソース読むのって疲れる。一から書き直した方が速かったかも。

あうあう、まだダメダメ

メタエージェントMAがエージェントAにパラメータの値を指示するのですが、 Aは指示された値をそのまま使う Aは指示された値より0.5小さい値を使う のどちらでも、メタエージェントは0.5付近の値を指示しようとする・・・ お前らそんなに0.5が好きか、と。単…