GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2010-01-01から1年間の記事一覧

REGZA Phone T-01C触ってきました

ヤボ用で大須行ったついでに、九十九モバイル館で。 ヤベーよ、ヌルヌル動くよ、回線速いよ。 なんか、HYBRID W-ZERO3+b-mobileSIMの環境が一回り周回遅れに見えてきましたorz でも、Xiモデルのスマートフォンは来年冬だそうですし、どうせならそれを待ちた…

温度調整を少し修正

前に書いた、対局開始からの手数によって探査率に差がある現象への対処。手数に応じて温度を別個に調整する様にしました。 んで、結果。7400局ほどの平均なので、そこそこ正確な値のはずです。グラフの横軸は対局開始からの手数、縦軸は探査率*1です。 目標…

次回選手権、どうしよっかなぁ

申し込み開始のメールが来てたんですが、まだ何の成果も出てないし、経済的にも色々厳しいし。 次回は一回休んで、もう一年じっくり強化するってのも考えてます。 とりあえず、申込期限の1月31日まで悩んで、それから決めますか。

も一回旧バージョンのパラメータで対局(VS ssp(本将棋モード))

色々触ったんで、もう一回基礎データとり直し。 706-12-398で勝率63.9%。95%信頼区間は61.0〜66.8。 さて、それじゃぁ新バージョンのパラメータを試してみますか。

docomo Xi対応のスマートフォンは2011年冬モデルから

http://k-tai.impress.co.jp/docs/news/20101224_416928.html 今はWillcomのHYBRID W-ZERO3を使ってるんですが、色々あってAndroidなスマートフォンに乗り換えを検討しています。 んで、ドコモのXi*1という高速通信サービスがそろそろ始まるってんで気になっ…

評価関数を駒割だけにしてテスト

角交換から馬の両成を防げないのを認識しない! バグ発見!! …と思ったら、評価関数のパラメータが変なだけでした。馬+歩一枚の損より、角を手持ちにしている方が得だというパラメータになってました。 まぁ、やっぱり探索じゃなくて学習部分の問題かぁ…

入玉勝ち宣言、そろそろ実装すべきか?

http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?go_last=on&csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2F%2F2010%2F12%2F21%2Fwdoor%2Bfloodgate-900-0%2BGasyou_Atom-D510_1c2t%2Bgps500%2B20101221073002.csa gps500相手にタイムアッ…

Sandy Bridge予価

http://www.gdm.or.jp/voices_html/201012/20101218a.html 私の欲しいのはCore i7 2600ですが、¥28,000となっていますね。意外と安い。 すぐには買えないけど、早く欲しいなぁ。

手数によって温度変えた方が良い?

ちょっと気になって、対局開始からの手数と探査率*1の関係を調べてみました。 んで、10〜19手目の範囲が探査率一番高くて、その後徐々に下がっていく傾向です。 ひょっとしたらこれが学習の上手く行かない原因かもしれないので、対策してみようと考えてます…

gps_normalに勝ってる!

http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?go_last=on&csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2Ftools%2FLATEST%2F%2F2010%2F12%2F17%2Fwdoor%2Bfloodgate-900-0%2Bgps_normal%2BGasyou_Atom-D510_1c2t%2B20101217090001.csa R差700にも…

VS ssp(本将棋モード)

引き続き方策勾配法で10日間学習させたもの。 129-7-216で勝率37.4%。95%信頼区間は32.3〜42.7。 だいぶ上向いてきましたので、このままもうちょっと学習させてみます。 ただ、序盤が相変わらずムチャクチャなので、ちょっと心配。囲わないし、簡単に敵に…

VS ssp(本将棋モード)

94-6-366で勝率20.4%。95%信頼区間は16.8〜24.4。 ようやく2割まで届きましたが、まだまだ先は長そうです。

探索深さを1→0に修正

対局数が足りてなくてまだ収束してない感じなので、自己対戦での学習時の探索深さを全幅0手+静止探索のみに変更。学習用マシンに投入しなおしました。

VS ssp(本将棋モード)

方策勾配法で学習したやつ。 結果、4-2-592で勝率…とかはいいか。割と論外な成績です。 さて、今日のバージョンだとどこまで改善されてるのか…

VS ssp(本将棋モード)

前回選手権時のパラメータ*1+最新バージョンのプログラムで一晩分。 結果、233-4-173で勝率57.4%。95%信頼区間は52.4〜62.3。 さて、後は最新バージョンのパラメータでどこまで行けるかですね。 *1:今floodgateに投入してるヤツ

VS spp(5五将棋モード)

384-?-597で勝率39.1%。95%信頼区間は36.1〜42.3。 何故か昨日より弱くなってますorz んで、本将棋だとどうなるか見てみたいので、一度本将棋モードで学習させてみます。ひょっとしたら、今の評価関数の実装での限界が、勝率5割程度って可能性もありますし…

VS ssp(5五将棋モード)

204-?-253で勝率44.6%。95%信頼区間は40.0〜49.3。 うーん、なかなか5割に届かないなぁ…

学習用マシンのプログラムを差し替え

結果が芳しくないんで、ちょっと設定変更。目標探査率を0.1から0.03に下げました。 まぁでも、望み薄かなぁ、これは。

FPGA統合Atom

http://pc.watch.impress.co.jp/docs/news/20101124_408976.html クロックは600MHz〜1.3GHz、FPGA部のスペックは不明。 面白そうなモノではありますが、当面私が使える用途はなさそうです。 てか、そもそも一般向けに小売されなさそうなシロモノですし、どっ…

VS ssp(5五将棋モード)

381-?-427で勝率47.2%。95%信頼区間は43.7〜50.7。 うーん、もうちょっと強くなってて欲しかったんだけどなぁ…

旧日記のデータをインポート中

結構量が多いんで、それなりに時間がかかると思います。 それから、日記間のリンクは修正しましたが、ひょっとしたらどこか変かもしれません。申し訳ないですが、ご了承下さい。 にしても、何でこう、忙しい時ってよそ事やりたくなるんだろう? 水平線効果か…

id:Gasyouが取れたんで、前の日記から引っ越してきました

http://d.hatena.ne.jp/streakeagle/ まぁ、はてなd→はてなdなんで、新鮮味には欠けますが。 過去記事のデータはぼちぼち移していこうと考えています。何故か今はデータのエクスポートが出来ないんで(ダウンロードボタンを押しても反応が無い)、後日になる…

VS ssp(5五将棋モード)

シグモイド関数のゲインを0.001に下げて学習し直したバージョン。 現在117-?-151で勝率43.7%。95%信頼区間は37.6〜49.8。 だいぶ上向いてきた感じはするんですが、TDLeaf(λ)バージョンに追いつくにはもうちょっと足りない感じです。 後数日の学習でもっと…

VS ssp(5五将棋モード)

評価項目を元に戻して、一から学習させなおしたバージョン。 結果は401-?-788で勝率33.7%。95%信頼区間は31.0〜36.5。 とりあえず、初日の結果だしこんなものでしょう。後は、どこまで伸び代があるかですね。

頭打ちっぽい

昨日ブログに書くの忘れてましたが、対sspは勝率4割程度。どうも、頭打ちらしいです。 という訳で、評価項目を元に戻したバージョンを学習用マシンに投入。今度はどこまで伸びるか楽しみです。

弱くなってるよorz

現在62-?-114で勝率35.2%。95%信頼区間は28.2〜42.8。 最新のパラメータファイルを持ってきて再度連続対戦させてみますが、どうしたもんか…

VS ssp(5五将棋モード)

427-?-559で勝率43.3%。95%信頼区間は40.2〜46.5。 確実に強くなってます。この調子なら、今週中に勝率6割まで行くかも。

GLOBAL DATA 3G DATA SIM

http://www.mifi.jp/sim/ 現在使用中のHYBRID W-ZERO3は3G通信用にb-mobile SIM U300を使ってるんですが、別のSIMカードがあるらしいんでメモ。 モノはGLOBAL DATA 3G DATA SIMっつー名前らしく、月額3990円で使い放題、通信速度はFOMAのフルスペックらしい…

Amazon EC2でGPGPUインスタンス

http://journal.mycom.co.jp/news/2010/11/16/108/index.html Tesla M2050が2個+Xeon X5570も2個、メモリは22GBらしいです。 値段は1時間2ドル10セント。日本円だと180円位でしょうか。 1日4000円、1ヶ月だと12万円位になるんで、そう簡単には使えなさそう…

現在42勝64敗

最初は勝ちが先行していたんで期待してたんですが、そう甘くはないみたいです。 ただ、昨日のバージョンよりは確実に強くなってるんで、今後に期待。