GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2012-11-01から1ヶ月間の記事一覧

まだまだデバッグ中

この三連休は引き篭もってひたすらデバッグ。 まず、方策勾配法エージェントの問題かと思ってその辺を調べてみるも、何も問題らしきものは無し。 それから、αβ探索ルーチンの探索結果をシンプルなミニマックス探索と付き合わせてみましたが、こっちも問題無…

ヤバい、何のアイデアも出ない

方策勾配法のデバッグは相変わらず成果無しだし、どうしよう… 残タスクとしては合議方策勾配法のマルチスレッド化して、軽い評価関数はより深く読んで学習出来る様にするってのは残ってるんですが、素の方策勾配法が上手く行ってないのに合議有りで学習して…

Broadwell世代ではデスクトップ向けCPUが製品化されない可能性

http://pc.watch.impress.co.jp/docs/column/ubiq/20121122_574440.html Haswellのシュリンク版であるBroadwell世代ではタブレットやウルトラブックに注力する為、デスクトップ向けのLGAパッケージのCPUは出ないという話があります。 リンク先には背景等色々…

ThinkPad USBキーボードのドライバ

気分転換にドライバ更新。 http://support.lenovo.com/en_US/detail.page?LegacyDocID=MIGR-73235 から「ThinkPad USB Keyboard with TrackPoint Version 1.08 (Win 8, Win 7, Vista, XP) tpusbkybdwtrackpoint_108.exe」ってファイルをダウンロードしてイン…

デバッグちう

…何の成果も出てません _| ̄|○ この調子じゃ、UEC杯は見送りかなぁ…

Xeon Phiの発売は来年1月から

http://pc.watch.impress.co.jp/docs/news/20121113_572526.html http://pc.watch.impress.co.jp/docs/column/kaigai/20121113_572568.html コードネームKnights ConnerことXeon Phiですが、来年1月に発売と決まった様です。 一般向けモデルは5110Pと3100シ…

↑で書いたバグは

結局テスト用ルーチン側のバグで、直したらちゃんとエラー出ました。あ、書いてなかったけど、評価関数のパラメータセーブ・ロード周りのテストをしてます。 んで、今日発見したのは評価関数のdelete時のメモリリーク1件のみ。どうせ評価関数の寿命はプロセ…

おかしい…

エラーメッセージ出るべき部分で出ない… 何でだ〜〜

&今後の予定

直近では11月24日に第6回UEC杯5五将棋大会がありますので、出来ればそれに参加したいです。 ただ、一昨日のGPW杯(5五将棋)を見る限りだと、何らかの改良をしないと上位には手も足も出ない感じなので、強化に成功したら参加の方向で検討中です。 あ、GPW…

みんな大好きOpteron

http://akiba-pc.watch.impress.co.jp/hotline/20121110/etc_amd2.html Piledriverコア採用の6300シリーズが受注開始らしいです。 最上位の6386 SE(16コア・2.8GHz)は約16万円とお高いですが、デュアルソケットなら個人でも手が届く範囲で買えそうですね。…

GPW論文紹介

という訳で、私が聞いていて気になった論文をざっくり紹介したいと思います。詳細に関しては後日論文が公開されるかと思いますので、そちらを参照して下さい。 後、多分に間違いが含まれているはずですので、詳しい事は論文参照という事でお願いします。 囲…

只今帰りました

小田原・名古屋間と名古屋・自宅間がほぼ同じ所要時間というちょっと _| ̄|○ な場所に住んでるんで、割と時間かかりました。 それでは、まずはお詫びから。GPW杯コンピュータ将棋大会の関係者の皆様、度々進行を遅延させる様な事をして申し訳ありませんでし…

ポスター発表\(^o^)/おわった

沢山の人に来てもらって、感謝感謝です。 名前は伏せますが、選手権で雲の上のひとがみえた時はビビリました。 今日はこれからGPW杯二日目です。全敗脱出目指して頑張ります。

小田原着う〜

長かった、、、

ようやく静岡

まだ先は長い。

おはようございます

今、電車に乗りました。名古屋駅での乗り換え時間が結構あるので駅弁を調達する予定。 これで現地着が12時過ぎだから、結構遠いですね。

色々やった結果

全幅1手で12万局学習したパラメータが最良という結果になりました _| ̄|○ 何でか分からないんですが、全幅1手のパラメータを引き継いで全幅2手で学習すると弱くなるんですよねぇ… この現象は大分前(数年前?)からあって、気になってパラメータのセーブ・…

えっ、なにこれ!?

ssp相手に11連勝しちゃってますよ。 …と思ったら、スクリーンショットをアップロードする間に一敗してます。11-0-1で91.7%の61.5〜99.8。 でもこれ、期待していいのか!? 対局結果が出る明日の朝が楽しみです。

あ、しまった…

5五将棋用の思考時間制御、どうしよう… 本将棋の方は、進行度と残り時間を元に思考時間を決めてるんですが、進行度計算には棋譜からの教師あり学習で作ったパラメータを使ってます。 んで、そのパラメータは5五将棋では使えない訳で… 今から5五将棋用に進行…

VS ssp(5五将棋モード)

まず、昨夜から今朝までの分(全幅1手で学習)は244-?-104で勝率70.1%。95%信頼区間は65.0〜74.9。 んで、今朝からさっきまでの分(全幅1手のパラメータを引き継いで全幅2手で学習)は374-?-169で勝率68.9%、95%信頼区間は64.8〜72.8。 磯部さん作の勝率…

アサーション外したら一気に強くなった

現在ssp相手に15-0-5。あ、書き忘れたけど5五将棋です。 んで、勝率75%キッカリになりました。キリが良いんで80%まで行ってくれると嬉しいなぁ… 学習は方策勾配法の派生アルゴリズム(今度GPWで発表するやつです)を使い、探索は全幅1手+静止探索(1段目6…

あんまり強くないですねw

…とか思ってたら、対局用exeをアサーション有効でコンパイルしてましたよ _| ̄|○ とりあえずアサーション外してリトライしてみます。

選手権まで残り半年を切ったわけですが

…この半年間、何の成果も出せてないです。 一応、論文書いたりその為のデータとったりで色々分かった事はあるんですが、問題点を修正してプログラムの強化に繋げるにはまだ至っていません。 まずいなぁ… 考慮時間残り半年あるけど、学習にかける時間を考える…

PiledriverコアのOptern 6300発表

http://pc.watch.impress.co.jp/docs/news/20121105_570956.html 最上位の6386 SEはベース2.8GHz、ターボ時最高3.5GHzだそうです。$1,352だそうなので、日本円で12万台半ばだと手が出そうな気がします。 合議が上手く行ったらこれで一台組みたいけど、どうな…

最後の悪あがき

GPW杯に向けて、最後の悪あがきをしています。 やってる事は単純で、最小分散ベースライン*1をやめて、平均報酬をベースラインとする、という事。 幾つか実験してみた限りだと、最小分散ベースラインより大幅に劣る事は無さそうですし、場合によっては良くな…

sakurapyonさんに反応されてたんでレス

逆に、悪い手の情報を共有するのはどうだろう? 末端で自玉が詰む局面を共有するとか。 https://twitter.com/sakurapyon3/status/263928819000414208 実はそっちはだいぶ前に思い付いてて、ブログには書きました。 → http://d.hatena.ne.jp/Gasyou/20100417/1…