GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2011-10-01から1ヶ月間の記事一覧

カーネル法適当実装その2

z=f(x,y)という二次関数を近似する問題を、多項式カーネルを使ってやってみました。 sinとかcosとかが絡むと精度がイマイチですが、2次までの多項式ならちゃんと近似出来るみたいです。 …にしても、動作原理がさっぱり理解出来ません。何でこんな簡単に非線…

カーネル法を適当に実装

とりあえずy=f(x)という形の関数を近似する問題を解けるか試してみました。 基本的に多項式カーネルで、一部ガウスカーネルも使用。 んで、色々試して分かった事。 一次関数・二次関数は普通に解ける。dを大きくすれば、三次・四次関数も多分解ける。 sin関…

ARMがv8アーキテクチャで64bit対応

http://www.geocities.jp/andosprocinfo/wadai11/20111029.htm メモリ容量増加のペースを考えると今から64bit化するのは必要でしょうし、対応するには悪いタイミングじゃないかも。 問題はWindows 8のARM版が64bit対応するかどうかですが、さすがにその辺は…

Nano X2搭載マザー発売開始

http://ascii.jp/elem/000/000/645/645906/ 1.6GHzのNano X2搭載Mini-ITXマザーが¥31,800。Atomマザーが1万円前後からある事を考えると、結構高いですね。 ついでに、冷却がファンありなんで静音化には向かなさそうな感じ。 これは見送りかなぁ、興味はある…

Ivy Bridge-Eの投入時期の噂

Intelは,LGA2011プラットフォーム向けのIvy Bridge-Eを2013年半ばに市場投入する計画を持っていたが,現在では,2012年第4四半期に前倒しするとも伝えられている。 http://www.4gamer.net/games/132/G013252/20111027090/ 記事の本題はSandy Bridge-E対応の…

修正版を投入

今まではグローバル詰みテーブルチェック→千日手・王手千日手チェックの順番だったんですが、これを逆にしました。多分これで大丈夫なはず。

王手千日手やっちまった

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2011/10/28/wdoor+floodgate-900-0+lesserpyon_sakura_vps_test+Gasyou_Atom-D510_2c4t+20111028113002.csa 多分グローバル詰みテーブルの実装がまずいんだろうなぁ… 早く修正しないと。

カーネル法について理解した事

http://str.i.kyushu-u.ac.jp/plone/news/7b2c1556de30fc30e030ed30e930df30f330ef30fc30af30b730e730c3-2010-gpw-10-8ad66587767a8868/files/gpw2010.pdf http://www.geocities.co.jp/Technopolis/5893/publication/kernel.pdf この辺の資料を参考に。 まず…

相変わらずひどいなぁ

http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2F2011%2F10%2F27%2Fwdoor%2Bfloodgate-900-0%2Blesserpyon_sakura_vps_test%2BGasyou_Atom-D510_2c4t%2B20111027230006.csa&go_last=on&move_…

とりあえずカーネル法

カーネル法によるパターン解析作者: John Shawe-Taylor,Nello Cristianini,大北剛出版社/メーカー: 共立出版発売日: 2010/05/25メディア: 単行本購入: 2人 クリック: 10回この商品を含むブログ (7件) を見る この本を図書館で取り寄せ頼んできました。¥7,14…

ひよこカルロ将棋さん結構強い

GA将!!!!!と当たったんですが、序盤からちゃんと指してます。モンテカルロ木探索木探索無しのモンテカルロでしかもできたばっかって事を考えると、かなりレベル高いですね。 http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?csa=http%3A%2F%2Fwdoor.c.u-…

AMD FX-8150の発売日と価格

http://www.gdm.or.jp/voices_html/201110/27a.html 水冷モデルが11/04で¥34,000、空冷モデルが11/11で¥25,000弱らしいです。 8コアモデルとして見るとイマイチな性能ですが、「4コアで2wayのマルチスレッディング可能なCPU」と考えれば、まぁ悪くない価格…

線形評価関数+強化学習+カーネル法、行けるかも

カーネル法による構造データマイニングって論文(2ページ目)にカーネル関数の使い方が載ってますが、これを読む限りでは表題の組み合わせ、行けそうです。 TD法ならほぼ確実に、方策勾配法でも多分OK。 上手く行けば「化ける」可能性あるし、ここはいっちょ…

強化学習とカーネル法

強化学習における価値関数の学習でもガウスカーネル関数がよく用いられるが,この場合でも事前知識を用いることにより,更に良いカーネル関数を構成することができる. http://sugiyama-www.cs.titech.ac.jp/~sugi/research-jp.html#theory-similarity-learn…

方策勾配法とカーネル法を組み合わせれないかと検討中

以前に自然方策勾配法の実装を検討した時は、パラメータ数が多すぎて無理(メモリに載らない)という理由で断念しました。ですが、STRさんの手法を真似てカーネル法を使えば、パラメータ数を減らせれるので自然方策勾配法が使用可能ではないかと。 低次元の…

もう、Ponder無しでいいや

思考時間が多少長くなったくらいじゃどうにもならない感じですし、Ponderは後回しにします。 という訳で、とりあえずは方策勾配法での学習にリトライしてみます。 シグモイド関数無しでの方策勾配法 実装は完了。現在テスト中。 レポート収集系の整理 パラメ…

ガーン

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/LATEST/players-floodgate14.html Gasyou_Atom-D510_2c4tが1c2tよりR下になってます。 上位のFireflyやBlunderXX-r3780_4cに勝てる事はあっても、対gps500の勝率が上がらないのが原因でしょうか。 合議を実装して…

グローバル詰みテーブルの連続対戦結果

対sspで一手一秒。232-1-88で勝率72.5%。95%信頼区間は67.3〜77.3。 前の結果だと勝率70.6%なので、あんまり伸びてないですね。う〜ん… あ、それから、floodgateで昨日落ちまくっていたのは0除算エラーが原因でした。現在は修正済み。対局相手の皆さんに…

最新版を投入

変更点は下記の通り。 グローバル詰みテーブルの実装 詰将棋ルーチンを有効に 思考時間の微調整 ただ、あんまり強くなってる感じしないし、期待薄かなぁ…

今日の見所

hiyoko_shogi_v0.12_1t1c 1844 8 7 0.533 on line 1812 Gasyou_Atom-D510_2c4t 1767 102 126 0.447 on line 1735 http://wdoor.c.u-tokyo.ac.jp/shogi/LATEST/players-floodgate14.html 駒割だけのソフトに負けてる駒割だけのソフトに負けてる駒割だけのソフ…

思考時間制御ありでsspと持ち時間5分で対局

前の結果はhttp://d.hatena.ne.jp/Gasyou/20111020/1319068898 参照。 今回は127-1-47で勝率73.0%。95%信頼区間は65.7〜79.4。ほぼ確実に強くなっていると言ってよさそうです。 …その割にはfloodgateでRが伸びないのは何でかなぁ…

トラックポイントキャップが当選しました

通販日記さんでのトラックポイントキャッププレゼントに当選しました(応募URLはこちら)。 mixiのThinkPadコミュニティで発見して、今日の夕方に応募したんですが、まさかその日のうちに当選通知が来るとは思いませんでしたw 単品で買うと数百円するもので…

序盤で時間使い過ぎかなぁ…

特にれさぴょん系相手で顕著なんですが、序盤で時間使い果たして終盤は1秒将棋になっちゃうケースが多いです。 http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2F2011%2F10%2F24%2Fwdoor%2Bfl…

ひよこ将棋さんに追い付かれそう

http://wdoor.c.u-tokyo.ac.jp/shogi/tools/LATEST/players-floodgate14.html floodgateの2週間レーティングで、GA将!!!!!は1782、ひよこ将棋さんは1747。もう、ほとんど同じ強さですね。 序盤でのiterationが13手程度(15分設定にて)、終盤で9手程度回るよう…

思考時間制御は割と良い感じ

実装前の結果だと105-2-73で勝率59.0%だったんですが、現在の途中経過では69-0-23で勝率75%。ほぼ確実に強くなってます。 floodgate見てると割とちゃんと持ち時間使い切りますし、それなりの形にはなっているかと。 …問題は、レーティングがあんまり上がっ…

ライバル不在のままCore i7-2700K発売

http://akiba-pc.watch.impress.co.jp/hotline/20111029/etc_intel.html AMD FX-8150はショップブランドPCでしか入手出来ないみたいですし、単品販売はどうなるんでしょうねぇ。 2700Kの方は、2600K比で通常時・ターボブースト時共に100MHzアップですし、順…

バグ、ようやく取れたかも

floodgateで一晩たってもエラー発生してないんで、多分大丈夫なハズ。 原因は、おそらくスレッドの優先度です。 まず、現在のGA将!!!!!では探索用スレッドが5つあり、合議クライアントが通常探索を行うスレッドが4つ。これはアフィニティマスク設定で特定論…

今までやった分を反映

シグモイド関数無しでの方策勾配法 実装は完了。現在テスト中。 レポート収集系の整理 パラメータのセーブ・ロードまわりのテスト ※問題無し NumericVectorクラスの高速化(プロファイルとって、学習が高速化出来そうなら着手) ※遅くなったんで断念 将棋用…

Atomマシンのエラーチェック

floodgate参戦用のAtomマシンに何か問題があるかと思い、Memtest86+・Windowsのメモリ診断ツール・Prime95でチェックしてみましたが、どれも問題無し。 負荷かけてる時にCPU温度を見てみましたが、熱暴走している雰囲気もありませんでした。 となると、どこ…

再現しねぇ…

開発用マシンでfloodgateに参戦してたんですが(Gasyou_Core-i7-940_2c4t)、Atomマシンで起きてたエラーが再現しないです。 となると、AtomマシンのハードウェアなりOSなりの問題か?