GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-05-01から1ヶ月間の記事一覧

ランボルギーニが排ガス規制を無視する方針

http://wiredvision.jp/news/200805/2008053021.html イイですねぇ、こういう方針の会社って。 私は車に関しては燃費良い方が嬉しいですけど、そういう事は抜きにして、こういう趣味に走った商売をするとこって好きです。 無視すると言ってもヨーロッパの規…

A級リーグ指し手1号さんの自戦記

http://aleag.cocolog-nifty.com/blog/2008/05/commentarii_de__fb6b.html http://aleag.cocolog-nifty.com/blog/2008/05/commentarii_de__9bab.html id:mkomiya:20080531:1212202924で知りました。最近RSSリーダのチェックしてなかったからなぁ… とりあえず…

NVIDIAのGT200&GT200b

http://northwood.blog60.fc2.com/blog-entry-2009.html GT200は後数週間でリリース。その後夏の終り〜秋にかけてシュリンク版のGT200b登場,と。 となると私はGT200b待ちですね。色々考えると。

一晩分 約4000局

遅くなってたorz 結果は後日見ます。 んでもって、一度学習率を下げてみようと考えて、0.1〜0.0001まで4通りでトライ。パラメータは引き継がずに初期状態から。

今日やった分を反映

将棋関連 TDLeaf(λ) 評価関数に特徴を追加 駒の種類・筋ごとの評価 駒の種類・段ごとの評価 駒の種類とその駒に利いている自分 or 相手の利きの数の評価 駒の種類・移動可能なマスの数(自由度)の評価 将棋のルールの細かい部分の実装 千日手・連続王手の千…

評価関数の修正完了

駒の種類と筋・段ごとの個別の評価。それから駒の自由度。 ざっと動かした感じではほとんど遅くなってないので、役に立たない事はあっても悪影響は小さいはず。 それから学習経過 約6万局を終局図だけざっと見て見たんですが…微妙。 囲おうという意思は感じ…

無性にコーディングしたくなってきたんで

今日は評価関数に特徴を追加します。ちょうど論文和訳は一区切りついたとこですし。 にしてもこれ、禁断症状なのかなぁ…

VIA Nano

http://pc.watch.impress.co.jp/docs/2008/0529/via.htm Isaiahと言うコードネームで呼ばれていた次世代プロセッサですが、名称が"Nano"に決まったそうです。 TDP高めで高クロックのLシリーズと、TDP低めで低クロックのUシリーズがあるそうです。 Uの方は1.3…

ずいぶん久しぶりのPhenom FXの噂

http://northwood.blog60.fc2.com/blog-entry-2005.html 45nm 4コアで3GHz。登場時期は来年第1四半期とか。 遅すぎるんじゃないかなぁ。時期的にも性能的にも。 まぁ、あれだ。AMDには頑張ってIntelの尻を叩いて貰いましょう。でないとNehalemで手抜きする可…

昨日書いた講演会

行く事にしました。 んで、交通手段の確保。行きはぷらっとこだまに決めたんで、週末にでも予約。帰りは夜行の高速バスで予約済。 三重県北部〜調布だと、交通費は往復で\15,000位で大丈夫そうです。 小宮さんや他の開発者の方と久しぶりにあえそうですので…

続々々 論文和訳

セクション4まで終了。 後1.5ページ。今週末あたりには終わりそうです。

第5回エンターテイメントと認知科学研究ステーション講演会

例によってCSA MLからの話題。 柿木さんの「Bonanza Methodで自己対戦からの学習」の話が聞けるって事で興味津々。 両夜行なら交通費は10000円チョイで行けそうだし、行こうかなぁ。 あー、でも、帰りはともかく生きも夜行だと体力持たない……かも。 ぬー、行…

論文読む時のBGM

基本的に集中したい時は音楽かけながら作業しているんですが、文章読んでる時は人の声が気になるのでゲームのサントラとかを聴いてます。 んで、手持ちのサントラを色々とっかえひっかえ試してみた結果、エースコンバット3のヤツに落ち着きました。エースコ…

Windows 7の公式情報

http://journal.mycom.co.jp/news/2008/05/28/010/index.html あちこちで記事がありますが、一番詳しかったところだけリンク。 んで、気になる内容はVistaのカーネルを改良したものって位しか載ってないです。 まぁ、Vista自体はおおむね気に入ってるので*1…

続々 論文和訳

section4の半分くらいまで。まだ先は長い。 つーか、いい加減知恵熱出そうです。

続 論文和訳

セクション3まで終了。これで明日はTD-directed(λ)とTDLeaf(λ)です。

論文の和訳

自分の名前を誤字していて死にたくなりました orz

も一つウィルコムネタ

http://www.willcom-inc.com/ja/corporate/press/2008/05/26/index_02.html 次世代PHSのブランド名は「WILLCOM CORE」らしいです。 つーとアレですか、速度アップしてCORE 2になったり、アンテナ二本でCORE 2 DUOになったりするわけですか。

WILLCOM 03

プレスリリース http://www.willcom-inc.com/ja/corporate/press/2008/05/26/index.html ウィルコム 製品情報 http://www.willcom-inc.com/ja/lineup/ws/020sh/index.html シャープ 製品情報 http://www.sharp.co.jp/ws/020sh/index.html D4とは違って、アド…

TDLeaf(λ)の論文を和訳中

どうせ後で見直す事になるんで、文書として残してます。ちゃんと理解しないと和訳出来ないんで、その分理解も深まるでしょうし。 んで、現在セクション2の強化学習導入部まで。まだ先は長いです。 それから、Wordの数式エディタが嫌になってTeX入れちゃいま…

GPW-08

http://sig-gi.c.u-tokyo.ac.jp/gpw/2008/ CSAのMLに流れていました。今年は11/7〜11/9らしいです。 さて、それじゃぁ有給の申請しとこうかなっと。

現実逃避気味に欲しいモノリスト

宝くじ当ったら買う。 HDCP対応の30インチ液晶。候補はNECのヤツ。 SSD。120GBで安いヤツが出てるみたいなんで、その辺。 無線LANルータ。ただ、802.11nがまだなんで、それを待つのもアリかと。 …現実逃避してないで論文読も。

やねうらおさんに反応されてた(汗汗

http://d.hatena.ne.jp/yaneurao/20080525#p1 色々検討されていた様ですが、実は私はそこまで深く考えてないんですよね。 と言うより、パラメータ手打ちの場合と学習する場合とでは根本的に考え方を変える必要があると考えています。 手打ちの場合は、可能な…

ゆめきさんがブログを開設

http://d.hatena.ne.jp/h_mitani/ なにげにコンピュータ将棋関係者のはてな使用率って高そうですね。

やっぱり強化学習部分が怪しいので

TDLeaf(λ)の論文を読んでます。 ……英語読んでると反射的に眠くなるのは何でだろう。学生ん時の刷り込みか?

風呂の中で冷静になって考えてみた

ランダム指し相手で勝つまでの平均手数が減らないのは、単手数で勝つ事を目標にしていない(手数とは無関係に報酬を与えている)ので、当然の結果かもしれません。 ただ、そうであっても序盤〜中盤の指し手が変なので、もうちょっと調べてみます。

わからん

評価関数の持ち駒の処理でおかしな部分は一つ修正したものの、それが根本的な原因とは思えないです。 強化学習エージェントの方は処理がごちゃごちゃしているので、読むだけでも苦労しています。 もう、いっその事エージェントを一から実装し直すか…って、そ…

VSランダム指しが微妙な結果に…

一晩動かした感じだと、ちゃんと探索した方が勝率ほぼ100%。 ただし、勝つまでの平均手数は20000局通じて50〜60手で変わらず。 可能性としては二つです。 一局だけで「最短で勝つ方法」を学習した。 実はほとんど学習していない(特に序盤・中盤)。 1は無い…

成果無し

バグは発見出来ず。 後手のε(ランダムに行動する確率)を1.0、先手は0.01で学習させてみましたが、2局目以降は先手が勝ち続けました。 よって、強化学習部分はちゃんと動いている(多分)。 評価関数も問題無し(多分)。 αβで探索するのもOK(多分)。 となる…

一晩分 約7000局

昨日の修正ですが、パラメータがどうも変です。 歩や金に自分の利きがあると大きくマイナス評価になっていたり、相手の利きが無い方がある時より評価が低かったりします。 どうもバグッてる可能性が高いですね。一度ソースを見直してみます。