GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-03-01から1ヶ月間の記事一覧

対局させてみたら、弱くなってた

例によってLesserkai相手にやってますが、駒割を無視しまくってて勝手に劣勢になる始末。どうしてくれよう。 やっぱり、ガウス正則化を切ったのが問題かなぁ。まずはパラメータを見て、その辺考えてみます。

Windows Updateにあわせて学習用マシンのプログラム差し替え

ちょいと体調崩してたんですが、そろそろ復帰。 んで、ちょうど学習用マシンを再起動する必要があったのでプログラムも変更。ログ表示まわりを少し修正しただけですが。 学習速度は、評価項目全部ありで1日6万5千局を少し超える程度。 王将周辺の利きとか駒…

富士通のスパコン向けCPU解説記事

http://journal.mycom.co.jp/articles/2009/03/12/sparc_viii_fx/index.html 1割も理解出来ませんでしたw 5ページ目にマルチスレッドアプリの動作タイミングをハードウェアで調整する仕組みが書いてありましたが、こういうのってx86では出来ないのかな? 出…

ちょっと横道それて、ソフトマックス方策の温度設定を自動化

と言ってもメタ強化学習とかそんな複雑なものではなくて、単純なルールベースのルーチンですが。 まず、方策内部で探査率(探索して得た最善手以外を指した割合)を対局中に計測します。 で、1局通しての探査率が目標値より低ければ少し温度アップ(探査しや…

「NVIDIAがx86 CPU市場に参入か!?」

ってニュースが数日前にありましたが、ハイエンドPC用のCPUを作るつもりは無いみたいですね。 http://journal.mycom.co.jp/news/2009/03/06/067/index.html 今はARMにGPU・周辺機器を統合したTegraを作ってますが、それのx86版を作るかもしれないって話だと…

初期化まで完了

局面の初期化のタイミングで、二駒の相対位置関係の初期値を計算する所まで実装完了。後は手を進めるタイミングで差分を計算してやればOKのハズ。 むしろ今日は、相互参照しているクラスやらグローバル変数の初期化でのエラーやら、本当にどうでも良い所で苦…

今から差分計算を実装する訳ですが

局面クラスいじるのか、気が重いなぁ… アレはどうも苦手です。

Larrabeeのクロックは2GHz台?

http://pc.watch.impress.co.jp/docs/2009/0305/kaigai493.htm 記事の本題はPS4にLarrabeeを採用する事のリスクに関してなんですが、それはあんまり興味ないんでほっといて、気になったのはここ。 Larrabee CPUコアは、Pentium(P54C)をベースにしており、ス…

VTuneの使い方を勉強中

チュートリアルを見ながら実際にGA将!!!を解析させて、色々遊んでます。 んで、全実行時間の半分弱を二駒の相対位置関係の評価時間が占め、その原因がどうもメモリロードの待ち時間が原因らしいとまでは分かったのですが、さてこれからどうするか。 キャッシ…

今日はほとんど成果無し

マルチスレッド関連で遅くなってるかと思ったんですが、色々調べた結果処理時間は無視出来るほどしかかかってないという結論に。ここをいじってもほとんどメリット無いでしょうから、チューニングは見送り。 という訳で、今日は上で書いたバグを一つつぶした…

変数の初期化漏れだった、死にたい

シクシク。 クリティカルな場所だったから、今までの学習結果は信用出来ないんで、バグ修正バージョンで改めて学習させます。

チューニングの前に

デバッグするはめになりました。泣きたい。

チューニング中

IntelのVTuneってプロファイラは体験版を30日限定で使えるらしいので、今はそれを使ってやってます。便利そうなら、高いですが購入してみようかと思います。 で、今日やった事。 駒の自由度を大駒のみに変更 二駒の相対位置関係の評価の修正 現状では評価項…

SEEの効果

連続対局・学習ともに高速化の効果はほとんど無し。という訳で、これからしばらくは地道にチューニングしてみます。

SEE実装完了(多分)

とりあえず動いてます。 使い道は、対局用のαβでムーブオーダリングに使うのと、学習用のムーブオーダリング。特に学習の方は速度向上の恩恵が大きいので、どれだけ伸びるか楽しみ。 という訳で学習用マシンのプログラム差し替え。今日までは1日6万6千局ペー…

SEE実装中

「普通のSEEのアルゴリズム」を知らないので、ほとんど我流ですが、「局面を動かさずに駒交換後の優劣を近似する関数」は出来ました。 あくまで近似なんで、ムーブオーダリングとかその辺に使っていこうと思います。

連続対戦がエラーで止まってた

USIの通信用クラスで、入力用バッファを1KBしか確保してなかったのが原因でした。 いや、選手権前にこのエラーを発見出来て、本当に良かったです。200手超えそうなあたりで出るんで、本番で出たら悔しいでしょうから。