GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-09-01から1ヶ月間の記事一覧

色々あってPCの構成を変えてたんですが…

グラフィックスカードを追加するだけなのに結構時間かかっちゃいました。 最近あんまりいじってなかったんで、すっかり勘が鈍ってます。 Core i7買う前にリハビリしたいけど、時間が…

Blunderはaki.さんのソフト?

私はマイムーブ西村さんのところで知ったんですが、こちらで参戦宣言されていますし、タイミングはあってますね。 私も年内には参戦したいなぁ…

物欲が…

というか、無性に「お金を使いたい」感じが… 何か、そこそこ役に立って数万で買える物ってないかなぁ…… 今ならデュアルコアAtomで一台組む? って、使い道がない orz

よくわからん

評価関数と探索ルーチンの組み合わせを色々変えてみたんですが、上手く行ったり行かなかったりで正直さっぱりです。 テーブル形式評価関数(初期値0、学習率0.1)+αβ1手 → 失敗(学習が遅いだけ?) テーブル形式評価関数(初期値0、学習率0.5)+αβ1手 → 成…

TDLeaf(λ)動かしてみましたが

例によって実行時エラーが発生。これは大体修正出来たと思います。 ただ、動くもののさっぱり学習してくれない(終了時の石差が変化しない)ので、明日ちゃんとログを見て修正します。

とりあえずTDLeaf(λ)実装完了

コンパイルが通る様になっただけなんで、実際に動かすのは明日にしますが。 方策は実装が簡単なεグリーディーのみ。ソフトマックスの方は一日かけてじっくりテストしないと絶対にバグが残るんで、休日にでもやります。 短期的な予定ですが、明日はTDLeaf(λ)…

TDLeaf(λ)実装中

まずは学習部分が完成。 と言っても、コンパイルが通る様になっただけなんで、まだ修正が必要とは思いますが。 もう少し時間があるので対局部分も今日中に実装しようかとも考えましたが、そうすると 実装→動かす→デバッグ って流れになって寝不足になるのが…

GPWどうしよっかなぁ

行きたいのは行きたいんですが、有給とって3連休なので開発もしたいし… プログラムの発表があってから、どうしても聞きたいのがあれば行くってのが無難かな。

リバーシでTDLeaf(λ)実装中

細々した事ばっかりであんまり書く意味無いかもしれませんが、書かないとダラダラしちゃうので書きます。 んで、完成時の構成はTDLeaf(λ)+ソフトマックス方策+線形の評価関数(使い回し)+メタ強化学習って感じを目標にしています。言語はJavaで書いて、…

いったん仕切り直し

リバーシでの予備実験 TDLeaf(λ)実装。 メタ強化学習で、状態を見て行動選択する様に変更。 εグリーディーとソフトマックス手法の比較。 TDLeaf(λ)とTD(λ)の比較。 ← 9月中にはこの辺まで 将棋関連 TDLeaf(λ)エージェントを再実装。 方策をエージェントから…

SpursEngine搭載の拡張カード

http://pc.watch.impress.co.jp/docs/2008/0910/leadtek.htm 例の、Cellの一部を切り取った様な構成のチップです。 …出たのは良いけど、個人的には使いどころが無いですね。 無難に行くならGeForce+CUDAにしますし、攻めるならLarrabeeまで待ちますし。 Pow…

DirectX11情報 @ 4Gamer.net

http://www.4gamer.net/games/033/G003329/20080908014/ http://www.4gamer.net/games/033/G003329/20080908021/ 2009年後半〜2010年前半に登場で、GPGPU向けの演算シェーダが実装されるらしいです。 という事は、最高に上手く行けばLarrabeeとほぼ同じタイ…

Intel CPUロードマップ @ PC Watch

http://pc.watch.impress.co.jp/docs/2008/0904/kaigai464.htm とりあえずCore i7は予定通り出そうなんで良いとして、6コアのWestmereが2010年にずれ込んでるみたいですね。 まぁ、プロセスシュリンク版はスルーする予定ですし、多分私には影響無いですが。 …

先手必勝という事で

GPW2008の初日は有給申請してきました。「年末にかけて忙しくなるよ」って言われても気にせず休みます。 んで、気になって去年のGPW前日の開発日記を探してみました。 …強化学習将棋が動いた日ですが。あんまり進んでないなぁ…… てか、あれから1年弱で、プロ…