GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2011-11-01から1ヶ月間の記事一覧

直線探索を実装

以前書いたテストの様子を見てると、序盤の評価値の変化がほとんど無いのがおかしかったです。 んで、ちょっと思い付いて直線探索を実装。これで、学習率が0.001なら学習前後で誤差が0.1%だけ減少する様になりました。 それから、TD(λ)のλを0.7から0.99に修…

カーネル法評価関数、どっかおかしい

評価関数だけのテストを以下の手順でやってみました。 適当な棋譜一局分に従って、初手から終局までの局面を作る。 以下を繰り返す。 終局図で先手勝ちなら+1、後手勝ちなら-1を目標として、終局一手前の局面のパラメータを調整する。 それ以外の局面は、そ…

うーん、やっぱり厳しい

パラメータをそこそこ速度寄りに調整して一晩走らせたんですが、24時間あたりの対局数が200を切ってます。 評価関数の特性上、カーネル法評価関数内部のハッシュ表の有効なエントリ数(≒学習時に使用した局面の数)が増えるほど遅くなっていくので、学習が進…

厳しいなぁ

覚悟してた事ではありますが、カーネル法評価関数はかなり重いです。 どれくらい重いかと言うと、線形評価関数だと24時間あたりの対局数が数万だったんですが、探索等の条件はそのままでカーネル法評価関数に変えると、対局数が数十にまで減ります。 んで、…

結局、将棋用にTDLeaf(λ)+カーネル法評価関数を実装する事にしました

どのみち後で欲しくなる可能性高いですし、将棋で学習ルーチンを2つ*1使えた方がメリット大きいので。 んで、とりあえず新規に評価関数クラスを作ってポチポチと実装中。局面を元に低次元の特徴量を計算する部分がまだですが、それ以外は完成しました。 まぁ…

駒同士の連携の評価

カーネル法の本を読んでいると「カーネル法を使えば、通常のベクトルとグラフや木構造をシームレスに扱える」ってな感じの事が書いてあります。 で、それなら駒同士の連携(「何番の駒が何番に利いている」という情報)を有向グラフにして、それを評価項目に…

カーネル法評価関数+TD(λ)での実験結果

テーブル形式評価関数での実験結果はこちら。 http://d.hatena.ne.jp/Gasyou/20111112/1321093400 一つひどいバグがあって、関数の引数で「先手から見た評価値」か「後手から見た評価値」のどちらを計算するか指定するんですが、その指定を無視して常に先手…

Knights CornerはXeonとソケット互換

http://blog.livedoor.jp/amd646464/archives/52232391.html IntelのMICであるKnights Cornerですが、PCI Express接続の拡張カードではなく、Xeonと同じソケットを使用する事になるらしいです。 コア数は50で倍精度浮動小数点数演算性能が1TFLOPSらしいです…

Ivy Bridge-EP情報

http://a96sj096.cocolog-nifty.com/weblog/2011/11/xeon-e5sandy-br.html こちらはSandy Bridge-EP(Xeon E5)後継となるIvy Bridge-EPの情報が載ってます。 10コア・25MB L3キャッシュとなり、2013年初頭に登場との噂です。 私が買うかどうかは未定ですが…

Ivy Bridge-E情報

http://northwood.blog60.fc2.com/blog-entry-5445.html 現行のCore i3 3000シリーズ(Sandy Bridge-E)と同じLGA2011ソケットで、登場時期は2012年第4四半期らしいです。 となると、更に次世代のHaswellファミリのハイエンドデスクトップ向けが2013年早期に…

Tegra+CUDAなスパコンが登場へ

http://pc.watch.impress.co.jp/docs/news/20111115_491068.html 今までもTeslaやGeForceを使ったスパコンはありましたが、それらはCPUにx86系を使っていました。 ただ、それだと電力効率が悪いので、CPUにARM系のTegraを使ったスパコンを開発するそうです。…

Sandy Bridge-E発表&発売

http://pc.watch.impress.co.jp/docs/news/20111114_490804.html http://akiba-pc.watch.impress.co.jp/hotline/20111119/etc_intel.html 最上位のCore i7-3960Xでも8万5千円と比較的リーズナブルなお値段ですね。 私はコストパフォーマンス考えて3930K辺り…

リバーシでカーネル法評価関数を実装開始

の前に、元の評価関数でテスト。条件は下記の通り。 4x4リバーシ TD(λ) ソフトマックス方策 初期温度10.0 テーブル形式評価関数 学習率0.5 結果はこうなりました。 学習条件 結果 収束までの対局数 先後とも学習 ○(-8) 約1万3千局 先手のみ学習 ×(+10) 約2千…

王手千日手の原因

詰将棋ルーチンでグローバル詰みテーブル参照→千日手・王手千日手チェックの順番になってたのが悪いかと思い、ここの順番を逆にしました。 αβ探索では以前に順番入れ替えたんですが、その時に考慮漏れがあってこっちの順番は入れ替えてなかったみたいですね…

また王手千日手やっちゃってる

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/11/11/wdoor+floodgate-900-0+sakurapyon-00+Gasyou_Atom-D510_2c4t+20111111200005.csa >>明日の俺 要検証

俺CiNii

http://sd.pot.co.jp/orecinii/ 「俺CiNii」とは 本アプリケーションは、「マイニング探検会」内「俺CiNiiチーム」による研究成果物です。サーバ提供については、有限会社スタジオ・ポットSDが行っています。 「俺CiNii」のカンタンな説明と使い方 「俺CiNii…

機械学習等で使われている「カーネル法」に関する質問です。

(このエントリは、人力検索はてなでの質問用のページです。分かる方がいらっしゃれば、http://q.hatena.ne.jp/1320930002 から回答して頂けないでしょうか。) 岩波書店の「カーネル多変量解析」を読みながら勉強中なのですが、分からない部分があるので教…

GPGPUでのカーネル法の高速化

が出来ないかとふと思いつきました。 多項式カーネルを使う場合は、結局はほとんどの時間はそこそこ長い*1ベクトルの内積の計算時間なんで、これはCPUよりGPUの方が向いてる気がします。 んで、探索と特徴ベクトルの計算はCPUがやって、その後のカーネル関数…

カーネル多変量解析

カーネル多変量解析―非線形データ解析の新しい展開 (シリーズ確率と情報の科学)作者: 赤穂昭太郎出版社/メーカー: 岩波書店発売日: 2008/11/27メディア: 単行本購入: 7人 クリック: 180回この商品を含むブログ (32件) を見る 届きました。早速読んでいこうと…

カーネル法の本

カーネル多変量解析―非線形データ解析の新しい展開 (シリーズ確率と情報の科学)作者: 赤穂昭太郎出版社/メーカー: 岩波書店発売日: 2008/11/27メディア: 単行本購入: 7人 クリック: 180回この商品を含むブログ (32件) を見る 結局これを買いました。 カーネ…

ノートPC欲しい

前の候補はThinkPad Edge E220sだったんですが、価格改定で高くなってしまった(Core i5-2467Mモデルが6万円弱→8万円弱)のと、名古屋で見てきたThinkPad X220iのキーボードが割と良かった*1ので、ちと迷ってます。 X220iの方はdocomoのXi契約すると約5万円…

次回選手権、どうしようかなぁ…

参加する・しないの話では無く、探索ルーチンの選択の話です。 とりあえず手元にあるのだと、以下の4つです。 シングルスレッドのαβ探索 マルチスレッドのαβ探索(旧バージョンから移植する必要有り) シングルスレッドのABC探索 合議 http://wdoor.c.u-toky…