GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-06-01から1ヶ月間の記事一覧

GeForce GTX 280/260発表

解説 http://journal.mycom.co.jp/news/2008/06/16/042/index.html レビュー http://journal.mycom.co.jp/articles/2008/06/16/g200/index.html 細かい数字までは確認していませんが、大体噂通りのスペック&価格。 コストパフォーマンス的には260の方が良さ…

講演会のメモ

http://minerva.cs.uec.ac.jp/~ito/entcog/contents/lecture/date/20080614.html 発表の資料は上記URLからダウンロード出来る様なので、そちらをご覧下さい。 ここの内容は個人的なメモですので、私が興味のある事に片寄ってます。 それから、頭に※印のある…

30bit表示のディスプレイ

http://pc.watch.impress.co.jp/docs/2008/0616/hp2.htm ちょっと興味はひかれましたが、24インチで$3499。 高いです。それと今より画面小さくしたくないんでパス。 30インチが$2499位になれば検討しますが、まぁまだ先の事でしょうね。

結局昨日は

一日中寝てました。食事の時以外は本当に泥の様に眠ってました。 つー訳で講演会の事はこれから書きます。

講演会から帰宅

夜行バスではほとんど寝れませんでした。 つー訳で、昼頃まで寝ます。講演会の話は起きてからって事で。

講演会場に着いたものの、早すぎでした。 ヒマ〜。

Intelの電力削減技術

http://www.itmedia.co.jp/news/articles/0806/12/news022.html http://techon.nikkeibp.co.jp/article/NEWS/20080612/153206/ まだ研究中で、現状ではOS・周辺機器の対応が必要な様ですが、将来的にはアイドル時・高負荷時共に50%の電力削減が可能だとか。 …

パラメータ使用頻度のリセット方法

えー、最初に書いておきますが、id:tihara:20080601で書かれている内容のパクリです。 まず、パラメータ使用頻度によるボーナス付加の現状の問題点として「対局数増加に伴ってパラメータ使用回数が増加し、探査がほとんど行われない状態になる」というのがあ…

局面評価時のパラメータ使用頻度の利用

現状のボーナスの付加は「学習時に使用した(特徴が非0の)頻度の低いパラメータが出現する局面に向かって行動選択する」という方式ですが、これだと局面評価時の使用頻度を無視しているので、ちょっともったいないです。 という訳で、評価時の情報もなんと…

短期的な項目

「王手したら勝ち」って条件でも上手く行かないので、それの対策。 ソフトマックス手法を試してみる 評価値が高い手ほど選択する確率が高くなるので、ひょっとしたら上手く行くかも 本格的に実装する事になれば、エージェントと方策の実装を分離する メタ強…

オプティミスティック初期値を実験中

…失敗でした。少なくとも、1000局で最短手数での勝ちを見つけるまでには至っていません。 それから、昨日の夜から一晩動かしていた、パラメータにボーナスを付加するバージョンですが、そっちも失敗。最短手数を見つける前にボーナスが減りすぎたのが原因ぽ…

GeForce GTX 280のゲームでの性能

http://blog.livedoor.jp/amd646464/archives/51215246.html 8800 Ultraの3-way SLIを上回るっつーとんでもない値が出てます。 これは期待してイイ…のか?

Bloomfield登場時のラインナップの噂

http://northwood.blog60.fc2.com/blog-entry-2042.html 私が狙ってる「上から二番目」のモデルは、2.93GHz・TDP 130Wらしいです。 TDPは結構騒がれてるみたいですが、ちゃんと考えてマシンを組めば空冷で十分冷却可能な値ですので、個人的には問題無し。 て…

Bloomfieldの発売時期

http://journal.mycom.co.jp/articles/2008/06/10/computex15/index.html 正確にはMSIのX58チップセット搭載マザーの発売時期ですが、"今年Q4の早い時期に発売予定"と書かれています。 …えー、ちょっと困る。金貯まってないでしょうから。 もしくはマザーは1…

評価値へのボーナス付加を実装

ついでに評価関数関連でのボーナスの処理方法を少し整理しておきました。 んで、肝心の結果。 εグリーディーよりはマシですが、まだ満足出来る結果ではありません。 探査を何とかしないと色々困るので、もうちょっと良い案 OR ボーナスの修正案が無いか考え…

状況を整理

昨日書いた条件で一晩対局させてみました。 んで、結果。ε*1は0.1でも0.01でも最終的には3手で勝てる様になる。ただし、そうなるまでの対局数はε=0.1の方が少ない。 要するに探査がうまく出来ていない、という事みたいです。 さて、どうしようか。以前試した…

色々やった結果

問題点は「勝つ為に(報酬を得る為に)は不要な手を指す」事なんですけど、結構対処は難しそうです。 (あ、対局の条件は上で書いた通り「後手玉に王手がかかったら後手が投了する」です。) 一手指すごとに-0.01の報酬を与えているので、原理的には不要な手…

上の補足

「報酬は勝ったら1、負けたら-1、一手指して決着がつかなかったら-0.01」と書きましたが、最後の-0.01はあくまで実験用という位置付けです。 本番の学習でそうやって報酬を与えると、「100手粘って結局負ける」よりも「王将が特攻して1手で負ける」方が報酬…

ちょっとだけ進展

というか、問題点が見えてきました。 まず、以下の条件で学習させました。 先手は1手読み。方策はε-greedyでε*1は0.01。 後手は5二飛と8二飛を繰り返し、王手されたら投了。 先手と後手の評価関数は別のインスタンスとする*2。 報酬は勝ったら1、負けたら-…

当面の方針

みなさん色々されてる様ですが、私はやっぱり学習にこだわります。 という訳で、まずは後手ランダム指しにして詰めるまでの手数をちゃんと短く出来るのを目標にします。 まずはもうちょっと簡単なところから始めて、後手玉に王手がかかったら後手が投了する…

Atom搭載マザーが秋葉原登場

http://www.watch.impress.co.jp/akiba/hotline/20080607/etc_atomcpu.html そして速攻で売り切れた模様。 にしても、CPUよりノースブリッジの方がヒートシンクでかくて、おまけにファン付きって(汗 SiSチップセットだと消費電力が下がるらしいって話ですし…

色々思い付いたので書き散らす

とりあえずTDLeaf(λ)+線形評価関数が上手く行かないので、それの対応策。 教師ありで学習してみる(評価関数・探索ルーチンは流用) TDLeaf(λ)のエージェント以外がちゃんと動作しているかの確認 + 情報収集が目的 いきなりニューロで評価関数を実装してみ…

Intel X58マザー

http://northwood.blog60.fc2.com/blog-entry-2017.html http://en.expreview.com/2008/06/03/computex%e2%80%9908-other-x58-mobos-following/ とりあえず大手メーカーは揃って出してくるみたいですね。 私はBloomfield + MCP80*1 + GT200b*2SLI構成って感…

6/14の講演会

行きのぷらっとこだまのチケットも購入完了。 グリーン車しか空席がなかったんでそっちで行きます。ちょっと豪華な新幹線の旅です(ただしこだま)。 後は当日朝に起きれるかですね。朝7時発の電車かぁ… かなり不安です。

論文和訳 完了

とりあえず明日にでも読み直してみます。

やっぱり今日は論文読みます

ちゃんと動いてるかもわかんないプログラムをチューニングしても無駄ですし。 今日中には論文の和訳を終えて、今週いっぱいかけて学習部分を調査&必要なら再実装。その後チューニングって流れで行こうかと思います。

昨日のニュース3点

Bloomfield*1 http://pc.watch.impress.co.jp/docs/2008/0602/kaigai442.htm Xeon系の話題は置いといて、Core 2後継の話だとExtreme〜$300台までがBloomfieldの当初のターゲットと明記されています。 Core 2 Duo登場時だとX6800・E6700・E6600の3モデルです…

色々思い付いた事を追加

本当に必要かどうかは後で検討する。(※マーク) 将棋関連 TDLeaf(λ) 評価関数に特徴を追加 駒の種類・筋ごとの評価 駒の種類・段ごとの評価 駒の種類とその駒に利いている自分 or 相手の利きの数の評価 駒の種類・移動可能なマスの数(自由度)の評価 評価…

論文和訳

section5まで終了。まだおわらんよorz 明日は評価関数内でのボトルネックがどこか調べてから、STLのstd::mapがそうならid:mkomiya:20080601:1212289141で紹介されていたアルゴリズムを実装予定。