GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2010-11-01から1ヶ月間の記事一覧

探索深さを1→0に修正

対局数が足りてなくてまだ収束してない感じなので、自己対戦での学習時の探索深さを全幅0手+静止探索のみに変更。学習用マシンに投入しなおしました。

VS ssp(本将棋モード)

方策勾配法で学習したやつ。 結果、4-2-592で勝率…とかはいいか。割と論外な成績です。 さて、今日のバージョンだとどこまで改善されてるのか…

VS ssp(本将棋モード)

前回選手権時のパラメータ*1+最新バージョンのプログラムで一晩分。 結果、233-4-173で勝率57.4%。95%信頼区間は52.4〜62.3。 さて、後は最新バージョンのパラメータでどこまで行けるかですね。 *1:今floodgateに投入してるヤツ

VS spp(5五将棋モード)

384-?-597で勝率39.1%。95%信頼区間は36.1〜42.3。 何故か昨日より弱くなってますorz んで、本将棋だとどうなるか見てみたいので、一度本将棋モードで学習させてみます。ひょっとしたら、今の評価関数の実装での限界が、勝率5割程度って可能性もありますし…

VS ssp(5五将棋モード)

204-?-253で勝率44.6%。95%信頼区間は40.0〜49.3。 うーん、なかなか5割に届かないなぁ…

学習用マシンのプログラムを差し替え

結果が芳しくないんで、ちょっと設定変更。目標探査率を0.1から0.03に下げました。 まぁでも、望み薄かなぁ、これは。

FPGA統合Atom

http://pc.watch.impress.co.jp/docs/news/20101124_408976.html クロックは600MHz〜1.3GHz、FPGA部のスペックは不明。 面白そうなモノではありますが、当面私が使える用途はなさそうです。 てか、そもそも一般向けに小売されなさそうなシロモノですし、どっ…

VS ssp(5五将棋モード)

381-?-427で勝率47.2%。95%信頼区間は43.7〜50.7。 うーん、もうちょっと強くなってて欲しかったんだけどなぁ…

旧日記のデータをインポート中

結構量が多いんで、それなりに時間がかかると思います。 それから、日記間のリンクは修正しましたが、ひょっとしたらどこか変かもしれません。申し訳ないですが、ご了承下さい。 にしても、何でこう、忙しい時ってよそ事やりたくなるんだろう? 水平線効果か…

id:Gasyouが取れたんで、前の日記から引っ越してきました

http://d.hatena.ne.jp/streakeagle/ まぁ、はてなd→はてなdなんで、新鮮味には欠けますが。 過去記事のデータはぼちぼち移していこうと考えています。何故か今はデータのエクスポートが出来ないんで(ダウンロードボタンを押しても反応が無い)、後日になる…

VS ssp(5五将棋モード)

シグモイド関数のゲインを0.001に下げて学習し直したバージョン。 現在117-?-151で勝率43.7%。95%信頼区間は37.6〜49.8。 だいぶ上向いてきた感じはするんですが、TDLeaf(λ)バージョンに追いつくにはもうちょっと足りない感じです。 後数日の学習でもっと…

VS ssp(5五将棋モード)

評価項目を元に戻して、一から学習させなおしたバージョン。 結果は401-?-788で勝率33.7%。95%信頼区間は31.0〜36.5。 とりあえず、初日の結果だしこんなものでしょう。後は、どこまで伸び代があるかですね。

頭打ちっぽい

昨日ブログに書くの忘れてましたが、対sspは勝率4割程度。どうも、頭打ちらしいです。 という訳で、評価項目を元に戻したバージョンを学習用マシンに投入。今度はどこまで伸びるか楽しみです。

弱くなってるよorz

現在62-?-114で勝率35.2%。95%信頼区間は28.2〜42.8。 最新のパラメータファイルを持ってきて再度連続対戦させてみますが、どうしたもんか…

VS ssp(5五将棋モード)

427-?-559で勝率43.3%。95%信頼区間は40.2〜46.5。 確実に強くなってます。この調子なら、今週中に勝率6割まで行くかも。

GLOBAL DATA 3G DATA SIM

http://www.mifi.jp/sim/ 現在使用中のHYBRID W-ZERO3は3G通信用にb-mobile SIM U300を使ってるんですが、別のSIMカードがあるらしいんでメモ。 モノはGLOBAL DATA 3G DATA SIMっつー名前らしく、月額3990円で使い放題、通信速度はFOMAのフルスペックらしい…

Amazon EC2でGPGPUインスタンス

http://journal.mycom.co.jp/news/2010/11/16/108/index.html Tesla M2050が2個+Xeon X5570も2個、メモリは22GBらしいです。 値段は1時間2ドル10セント。日本円だと180円位でしょうか。 1日4000円、1ヶ月だと12万円位になるんで、そう簡単には使えなさそう…

現在42勝64敗

最初は勝ちが先行していたんで期待してたんですが、そう甘くはないみたいです。 ただ、昨日のバージョンよりは確実に強くなってるんで、今後に期待。

VS ssp(5五将棋モード)

313-?-641で勝率32.8%。95%信頼区間は29.8〜35.9。 とりあえず、以前よりはまともになった感じです。後は二日・三日の学習でどこまで伸びるかですね。

ようやくssp相手に3割

方策勾配法で学習していたやつですが、ようやく3割程度勝てる様になってきました。 現在48-?-111で勝率30.2%。シグモイド関数のゲインを0.01に上げて、一晩学習させたバージョンです。 この調子で強くなって、2〜3日で勝率6割まで行けばいいんですが… んで…

3TB HDDの解説記事

http://pc.watch.impress.co.jp/docs/column/hirasawa/20101115_406951.html ブートドライブやデータドライブとして使用する際の条件等が詳細に載っています。 来年辺りに組む地デジ録画用PCは2TBのHDDを積む予定ですが、後々増設って事も考えられるので、今…

シャープのスマートフォン事業説明会

http://pc.watch.impress.co.jp/docs/news/20101115_407015.html 色々強気なのは頼もしい限りなんですが、キャリアは大手三社のみでウィルコムのウの字も出てこないです。残念ながら。 後、OSはAndroidばっかりでちょっと面白く無いかなぁ、とか思ったり。 …

IntelがLarrabee改めKnightsシリーズに言及

http://cloud.watch.impress.co.jp/docs/news/20101111_406140.html スライドではクロックが1〜1.2GHzとなっていますが、商用版のKnights Cornerではもっと高クロックになるのを期待。コア数多いので無理かもしれませんが。 ともかく、言及があったという事…

今後の方針について検討中

方策勾配法でパラメータ数が多い場合に学習出来ないとすると、それじゃぁその次はどうするんだって話です。 んで、今はざっと二つ案があります。 頑張って方策勾配法で何とかする。 TDLeaf(λ)やTreeStrap(αβ)に戻る。 出来れば前者で何かしたいけど、現状で…

印刷してみたら、評価関数だけで55ページあった件

長すぎ&重すぎ。 ファイルサイズ見たら112KBだった。無駄に色々書いてるなぁ。

設定変えて学習用マシンに投入

相変わらず方策勾配法で学習出来ないかやってます。 んで、まだ5五将棋でsspにもTDLeaf(λ)バージョンにも追いつけてないので、思い切って設定変えたのを投入。 評価項目を駒割+筋・段個別の絶対位置評価+王将の移動可能範囲(距離3まで)に変更。 パラメー…

Bulldozerは2011/4に量産開始らしい

http://blog.livedoor.jp/amd646464/archives/51744010.html 選手権に間に合うかは微妙な感じですが、ようやく出てくるのか、といった感じです。 Bulldozer NG(Bulldozer 2)についても、新命令サポートで開発が進められているそうです。 後は実際の性能で…

4x4リバーシに戻ってちょっと実験

今までは4x4リバーシは探索無しの方策勾配法で、5五将棋は探索有りの方策勾配法で学習させていました。 んで、探索有りの方策勾配法に問題があるんじゃないかと思い、4x4リバーシで探索有りの方策勾配法を試してみました。 結果↓ 探索有り(depth==4)の方が…