GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2007-04-01から1ヶ月間の記事一覧

王将の移動範囲の評価・学習を実装

去年のアルゴリズムをほぼそのまま移植。一部の低レベルな処理を工夫したのでちょっとは速くなってるはず。 てか、去年のが遅すぎたんですよね。ほぼ50%の確率で分岐するif文が3つ連続であったんですから。 それはさておき、アルゴリズムをざくっと説明する…

OK,もう無理

二駒の位置関係の評価を断念しました。 どうもどっかバグッてる可能性もあって、使用すると手の一致率ががた落ち&学習するほどさらに落ちるって状況です。 仮に今日明日にバグが発見出来てもそっから学習する時間がないので、今回は無し。 で、評価項目は以…

一回休み

メモリを無駄遣いしている関係でスワップイン・アウトが頻繁に起こっている様で、予想よりかなり遅くなっていました。 で、どうもHDDとiRAM*1の二箇所にスワップファイルを作っていたのですが、WindowsがHDDの方から使っている様子。 いまの所はHDDが必要に…

二駒の位置関係をリトライ

大枠は以前作ったコードのままで、パラメータの保存方法だけ修正。結構ローレベルで保存方法を変えてたので、あちこち変更しないと駄目でした。 やっぱ、まとまったデータは最初からクラスなり構造体なりにまとめとかないと後で大変ですね。 で、学習率は少…

昨日の結果

王将周辺の利きの評価・学習のあり・無しで一致率がそれぞれ34%と29%。はっきり上回りました。 で、どうも今までは学習が足りなかったみたいですね。 ただ、ありにすると、ある時点から学習用棋譜に対する一致率が上がるのに検証用棋譜に対する一致率が下…

学習高速化の結論

“学習率を限界まで高くする”。慣性項を色々いじった結果こうなりました。 うーん、慣性項って扱いが難しいですねぇ。下手に高くすると望ましい値付近で振動しますし、かといって低いと効果が無いし。 おまけにパラメータ数が変わると(=評価項目を変更する…

OK,My Boss

きっかり一時間。うち55分は船の設計してましたけどね。 さて、それじゃぁ開発始めますか。まずは二駒の位置関係の復活&修正の予定。

さて

ちょっと南太平洋に出稼ぎに行ってきます*1。1時間ほどで帰宅予定。 ・・・ホントですよ? *1:要するに鋼鉄の咆哮

昨日の修正の結果

バッチ更新モード・王将周辺の利きの評価ありで検証用データとの手の一致率24%。まずまずです。王将周辺の利きの評価無しをはっきり上回りました。 てか、パラメータの統計を見るとまだ収束してない感じ。つまりもう少し伸びそう。 ただ、高々数千のパラメ…

パラメータ更新ルーチンを修正

今までは棋譜の手を一手読み込むごとに更新していたのですが、全学習棋譜の手を読み込んだ後にまとめて更新する様にしてみました。 たしかオンラインからバッチに修正したとかそんな風に表現する、はず。 で、ついでにバッチ更新モードでは学習棋譜での出現…

さくっと検証完了

棋譜の最後5手だけで正解率を出してみたら、王将周辺の利きの評価ありが約34%、無しだと約31%でした。 で、どうも序盤・中盤は役に立たない評価項目になってる様な感じです*1。 そんな訳でこいつはとりあえず有効にしといて、他の評価項目を作り込みます。…

ずいぶん久しぶりです

四日ぶりくらい? 職場の先輩の結婚式(二次会)に行ってたり鋼鉄の咆哮やってたりで、全然進んでないです。 てか、鋼鉄の咆哮、買うんじゃなかった。つまんないって事は全然無くて、はまり過ぎって意味で。 さて、学習の結果ですが王将周辺の利きの評価のあ…

昨日の修正の結果

結局正解率は王将周辺の利きの評価・学習の有無にかかわらず21%。 ただ、利きの評価をすると同じ時間でも学習の回数が減少するので(評価関数が重くなるから)、ちゃんと収束する所まで行ってなさそうな感じです。 という訳で、今日は開発は無しにしてもう…

PenrynのL1は命令・データ各32MB!

つ http://itpro.nikkeibp.co.jp/article/NEWS/20070418/268786/ の一番上の写真。 ウソです(多分)。試作段階のプロセッサだからどっか変なだけでしょう。

たいしたバグは発見出来ず

パラメータの左右を逆に扱っていて、本来右のマスのパラメータとして扱うべきなのに左のマスのパラメータとして扱い、左として扱うべきものを右として扱っていました。 が、学習も評価も同じ様に間違って扱っていたので、結果としてはちゃんと動くはず。 な…

GeForce 8600/8500シリーズ発表

PC Watchで現行GPU各種とのベンチ結果が比較されていますが、GeForce 7600GTよりは上。ただしアプリによって結構性能がばらついてるみたいですね。 とりあえずローエンドの8500 GTを買って、CUDAでニューロを動かすのが速かったら8800/8900の下の方の製品の…

Intel曰く「x86で1TFLOPSを目指すプロセッサの開発に着手」

Tech On! より。 浮動小数点演算の性能を伸ばすのもいいけど、整数演算の性能も伸ばして欲しいなぁ。 って、ひょっとしてこれ、Intelが開発中のGPUの話でしょうか?

Intel関連の新しいコードネーム二つ(Silverthorne&Sandy Bridge)

SilverthorneはTech On!にダイ写真が載っていますが、2008年に予定されている(おそらくフルスクラッチの)LPIAプロセッサ。 なんか、妙に細長かったり(IOのパッド確保の為?)、キャッシュらしき部分がやたら小さかったり、デュアルコアっぽかったり(似た…

Intel Ultra Mobile Platform 2007の正式発表

PC Watchより。 要するにLPIA*1を含むUMPC向けプラットフォーム。 気になるのは正式発表自体ではなく、ドコモがこれに興味を示してるらしいって事。WILLCOMはどうなんでしょ? *1:Low Power Intel Architecture :ノートPCよりさらに小型のデバイス向けx86プ…

評価関数を用いた終盤度の計算

たいしたアイデアじゃなくて、評価関数学習時に“評価値の目標値”ではなく“棋譜での残り手数”を与えてやればいいんじゃないかと。ただそれだけです。 ま、簡単お手軽実装でOKですので、空き時間にやってみます。

評価項目追加の結果

正解率変わらずorz バグがあるかもしれないんでソースを見直してみます。

とりあえず一つ評価項目追加

自玉・敵玉周辺の自分と相手の利きの数を評価。 範囲は王将周辺のみで幅11高さ9。この値はいずれ調整しますが。 パラメータ数は2.9倍弱になって約6600。これ位の数ならちゃんと学習して欲しいところです。 で、この評価項目を追加してちゃんと学習率が上…

0x17〜0x22歳

この表現って一般的じゃない事に今更気付きました。

昨日改良した結果

いや、改良と言うより“バグを仕込む率を下げる為にデータ構造を整理した”って方が正確ですが。 なので、学習結果は特に変わり無し。 あ、そうそう。絶対位置テーブル+持ち駒評価と絶対位置テーブルのみを比較してみました。 で、棋譜の手との一致率はそれぞ…

SSDが秋葉原で発売

AKIBA PC Hotline!より。 4GBモデルで4万円強なのでかなり高価ですね。もうちょっと色んなメーカから出てきて安くなるのを期待。

Core 2 Extreme QX6800

PC Watchより。 QX6700のクロックアップバージョン(2.93GHz)で、それ以外の仕様は同じくL2 4MB×2・1066MHz FSB・TDP 130Wって感じです。 今まではX6800(高クロックのデュアルコア)とQX6700(ちょっとクロックの低いクアドコア)が共存していましたが、…

久々の更新

オープン戦で全敗してorzしていた・・・訳ではなく、ゲームにはまってましたw 鋼鉄の咆哮ってゲームなんですが、仕事と寝てる時間以外はほぼ全てそれに費やしてました。ウェブ巡回もメールチェックもせずに。 まぁでも、とりあえず一周クリアしましたし、ぼ…

記憶の中の3三角成り5/18発売!

開発者日記より。 いやもう、選手権直後と言うナイスタイミングがブラボーです。

オープン戦終わりました

“パラメータの読み込みに失敗する”という致命的なバグが3回戦終了後に見つかりました。 ・・・終わりましたorz

CSA将棋との接続完了

てか、以前作ったコードを整理して修正しただけ。 で、パラメータは二駒の位置関係を無効にして絶対テーブル+駒台で行く事に。 明日のオープン戦直前まで12時間ほどあるので、学習関連のパラメータを色々変えた4プロセスで並行して学習させて、その時点で最…