GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-01-01から1ヶ月間の記事一覧

学習用マシンのプログラムを、静止探索を修正したのに差し替え

旧バージョンは1日8400局のペースで動いてました。 んで、これがどこまで落ちるか。7000は超えてて欲しいですが…

静止探索を少し修正

静止探索1段目の初期値は「パスした後にStand-Patで*1探索した値」を使っています*2。 んで、初期値が“勝ち”や“負け”の値であれば、そのノードでは全幅で読んでいます(どっちになったにしろ、手を絞った結果評価値がおかしくなると困るので)。 そうすると…

九十九電機、事業譲渡が確定

http://journal.mycom.co.jp/news/2009/01/31/018/index.html ヤマダ電機側との契約が成立し、3/10に譲渡だそうです。 実際の店舗がどう変わるかはまだ分かりませんが、良い方向に変化するのを期待しています。

しまった、更新してなかった

ログ出力まわりの整理 評価関数の再実装 ついでに王将との相対位置評価を実装 ルートノードでの枝刈り マルチスレッド化 探索ルーチンの修正 ちゃんとプロファイルとる 上の結果次第で、二駒の相対位置関係のチューニング

1日8000局は行きそうな雰囲気

「3倍速いから赤く塗ろう」ってネタが無駄になりました。 いやしかし、6倍速って今までどんだけ無駄なコードだったんだ…

ところで選手権の参加者リスト見てて思ったんですが

みんなそんなにCore 2が好きか! 正直、Core 2 ExtremeとQuadで半分くらいは占めそうで、Intel一人勝ちの影響がこんなところにも… そしてCore i7はいらない子ですかそうですか。シクシク

評価関数の再実装完了

クラス名がLinearEvaluator3で、今3代目です。C++の実装になってから。(Java時代から数えると、多分4か5代目。) んで、前の評価関数と同じアルゴリズムを、単純に高速化する様に実装し直しました。ランダムに生成した棋譜での学習では、新旧両方で結果が一…

ニューラルネットの本4冊目購入

ニューラル情報処理の基礎数理 (情報システム工学)作者: 中野良平出版社/メーカー: 数理工学社発売日: 2005/11/01メディア: 単行本 クリック: 8回この商品を含むブログ (3件) を見る コンピュータ将棋関係だとちょっとタイムリーな人が著者ですが、それに関…

NOD32 v3.0とPOPFileの設定

受信関係の構成 gmailサーバ → POPFile → Thunderbird NOD32をv2.7からv3.0にバージョンアップしたら、Thunderbirdで受信出来なくなったので、対処方法をメモ。 やる事は簡単で、メールサーバの設定を"localhost"から"127.0.0.1"に変更する。これだけ。 つい…

巡音ルカ姉さん本日発売

という訳で、これは張るべきだと思いました。 プログラマ的には、Hello Worldも必要。

評価関数の再実装がまだ途中

一応、実装は終わりました。 ただ、動かしてみるとバグがあって、しかも基本的な間違い(足し算と割り算の優先順位間違いやら、1.0と0.1のタイプミスやら)が結構ありました。 今日は昼からずっとやってて、疲れてるのかもしれません*1。 つー訳で、残りのテ…

Larrabeeは既に動作するチップがある?

http://japan.cnet.com/news/media/story/0,2000056023,20387350,00.htm 「Larrabeeを使って立体映像のレンダリングをし、それを2月1日に公開する」って書いてある様に読めるんですが。 Larrabee自体は今年後半か来年に発売って話でしたけど、今の時期に動作…

GPWでの重ね合わせによる評価関数の学習論文

とりあえず一通り読んで、動作についても理解出来たはずです。 論文とかid:mkomiya:20090124:1232754122とかで分かりやすい説明があるんですが、あえて一言で書くなら「共有価値(パラメータ)の導入によるスパース回避」って感じでしょうか。 例えば駒割の…

明日は休み&自動車免許更新

どうせ手続きとかで待たされるんで、GPWの論文集とか持って行って読む事にします。

評価関数を再実装中

ちまちまと。特に面白い事やってる訳じゃないんで、ここに書くほどのネタもなかったり。

待て待て、これは孔明の罠だ

大きな話題がありますが、あえてその話題からは外れたところでひっそり過ごす。そういうヤツがいたって良いじゃないですか。 まぁでも、今から使い始めて3ヶ月で完成するかってーと…スキルさえあれば可能、か。

ログ出力を修正中

基本的に関数名を置換してから関数の引数を二つ消すだけで、ぶっちゃけ単純作業でつまんないです。 まぁ、今まで放置してたツケを払ってるんだと思って、ぼちぼちやってきます。 そういえばVisual C++ 2005って、__FUNCTION__マクロでクラス名・関数名を取得…

当面の方針として

ログ出力まわりの整理 評価関数の再実装 ついでに王将との相対位置評価を実装 ルートノードでの枝刈り マルチスレッド化 探索ルーチンの修正 ちゃんとプロファイルとる 上の結果次第で、二駒の相対位置関係のチューニング ログ出力は性能面以外でもメンテや…

そういえば駒の自由度は差分計算出来るかも

そうするには局面クラスを修正しないとなー、とか でも、局面クラスをいじり始めると、どツボにはまるだろうなー、とか どうせいじるなら、色々なメタデータ(自由度とか利きの関係とか)を扱う枠組みが欲しいなー、とか そこまでやるならLarrabeeで移植する…

CodeAnalystを試してみる

http://developer.amd.com/cpu/CodeAnalyst/codeanalystwindows/Pages/default.aspxからダウンロード・・・しようとすると、ファイルが無いって怒られる。 んで、HDDに残ってたVer 2.69.248.0115ってやつをインストールしたものの、ソフトがベータ版だからか…

レオパルドかわいいよレオパルド

こいつ → http://www.sorakake.net/tech/index.html 金色の玉をぶつけられて「絶望的に痛い」だとか、一発発射して「充・足・感」とか、いちいち言う事がかわいすぎるんですけど。 ちなみに性的な事じゃないので卑猥な想像しないで下さいえっちなのはいけな…

K-Shogiさんのブログ

http://d.hatena.ne.jp/studio_k/ K-ShogiのPONTAさんがブログを開設されてました。

てゆーか

相変わらずダラダラと書きすぎです。もうちょっと何とかならないものか > 自分

短期目標

当面の方針は「ひたすら高速化する」ですが、今まで書いてなかった事も含めてまとめときます。 まず、やる予定の事。括弧内は速度向上率の目標値。 マルチスレッド化 (x6) 評価関数の再実装 (x3) 二駒の相対位置関係のチューニング (x1.2) ログ出力まわりの…

とりあえず王手将棋でのやり残し終わらせました

先後入れ替えてもちゃんと収束。ある程度有望そうな温度でざっと動かしただけですが、多分大丈夫でしょう。 んで、上のTODOには反映済み。 今日はGPWの論文集とか色々読みたいんで、コーディングはもう終了にしときます。

CSA MLの件というかプログラム名の件というか

勝手に転載するとダメでしょうから伏せ字で書きますけど、I藤さんとかY本さんとか、ソフト名が面白すぎるんですけど! これは、私も何か面白くてインパクトのある名前を考えざるを得ないじゃないですか。

プラン再構築

将棋の学習関連 TDLeaf(λ)エージェントを再実装。 方策をエージェントから独立させる。 学習中の各種統計情報の収集・表示ルーチン実装。 std::vectorあたりを勉強しとくこと。 王手将棋での予備実験。 εグリーディーとソフトマックス手法の比較。 評価関数…

一晩動かした結果

エラーとかアサーションに引っかかったとかはなく、とりあえず動いてました。 対局数は20.5時間で1800局なので、24時間で2100局ペース。ただし、評価関数で一部の評価項目を無効にしているので、その辺は割引いて考える必要はありますが。 目標対局数を24時…

静止探索をαβに変更

MTD(f)はあきらめます。 んで、多分ちゃんと動いてますが…遅いです。一局に分単位で時間がかかるので、とてもじゃないですがこのままでは学習が進みません。 という訳で、何か手を考えないと。アイデアはあるんで、それがちゃんと動くかを試してみます。

MTD(f)で苦労して気付いた事

MTD(f)自体がnull window searchの繰り返しなんで、それぞれの探索は「厳密に同じ条件で」実行する必要があるみたいです。 例えば、次の二つはどちらもNGでした。 現在の探索は残り深さ2で、ハッシュに残り深さ4の評価値があったので、ハッシュの値を流用す…