2013-11-01から1ヶ月間の記事一覧
一切枝刈り無しの状態から、LMRとNull Move Pruningを有効にすると棋譜との一致率がどう変化するか調べてみました。 評価関数は上と同じで、ほぼ駒割のみです。 んで、結果↓。 LMR無し LMRあり Null Move無し 29.3% 32.0% Null Move有り 30.4% 28.8% え…
駒割のみちゃんとした値を設定した結果、棋譜1局との一致率は28.2%でした。 という訳で、学習して一致率が上がるかを試してみます。 …と言っても、少なくとも明日までは学習の時間がかかるので、その間は別の所にバグが無いかチェックしてみます。
探索テスト用ルーチンで評価値の差分計算がちゃんと出来ていないのが原因でした。 んで、そこを修正したら300kNPS前後でイテレーションがちゃんと回る様になりました。 それから、デバッグ中にUSIモードでαβが遅くなるバグも発見したんで、そこも修正。 さて…
とりあえず静止探索二段目のルーチンを、Inside KFEndのコード通りに修正。今までは王手の場合は全ての合法手を生成していましたが、それだと無駄に遅くなるらしいのでやめにしました。 んで、ザックリと探索のテスト用ルーチンを走らせてみました。 …何かお…
実行ステップ:17,581 → 17,241 コメント:5,239 → 5,148 上記合計:22,820 → 22,389 えー、500ステップ弱しか減ってません。 コード減らすのは結構難しいですね (´・ω・`)
Twitterで平岡さんにアドバイス貰ったんで、Gitの本格運用開始&ソースコードの整理をしてみます。 んで、とりあえず現状のステップ数。 実行ステップ:17,581 コメント:5,239 上記合計:22,820 不要なコードをコメントで消してるのもあるんで、その辺も含…
眼精疲労ってやつかな? よく分かんないけど。 まぁ、今日はゆっくり本でも読みつつ寝る事にします。基礎からやり直すのは明日からですね。
5五将棋の学習で、評価関数は駒割Onlyで、静止探索を無くしたり全幅探索も無くしたりしましたが、それでもちゃんと学習してくません。 という訳で、方策勾配法の理解が根本的に間違ってる疑惑が出て来ました。 てな事で、一旦多腕バンディット問題とか迷路脱…
ブースティング - 学習アルゴリズムの設計技法 (知能情報科学シリーズ)作者: 金森敬文,畑埜晃平,渡辺治,小川英光出版社/メーカー: 森北出版株式会社発売日: 2006/08/25メディア: 単行本購入: 1人 クリック: 24回この商品を含むブログ (9件) を見る 当面ブー…
5五将棋で駒割の歩の値は1に固定して、他のパラメータ(駒割・位置評価etc)を学習させてますが、駒の価値が発散しています。 歩が1なのに飛車が50とか龍が100とか、明らかに異常です。 …何でこんなんで三目並べ・リバーシは学習出来たんだろう?
今更ですが、電王戦への参加はキャンセルしました。 PGLeaf(方策勾配法)での学習ルーチンを書き直した際にどっかエンバグしてるらしく、無茶苦茶弱いんで大会に出るにはちょっと…という感じでしたので。 選手権までには何とか学習を成功させたいけど、出来…