GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2013-05-01から1ヶ月間の記事一覧

リバーシのPGLeafも完成

とりあえず4x4では正常に収束しました。 つー訳で、これから本命の将棋関連の実装開始です。 局面クラス関連に2ヶ月、評価関数と探索ルーチンに各1ヶ月かかるとして、9月末には動く様になるかな?

学習用マシンの構成案

本命はこの前書いたXeonデュアルマシンなんですが、それ以外の構成も検討してみようってコトでザックリと予算・性能をまとめてみます。 CPU コア数 メモリ おおまかな性能 その他 価格 Core i7 3770K 4 32GB 1.0倍(基準値) 現在のマシン 0円 Ivy Bridge-E…

リバーシ関連もほぼ完成

とりあえず局面クラス・指し手クラスは完成。学習させるとちゃんと収束しました。 ただ、現状ではαβ探索を組み込んでいない、素の方策勾配法(REINFORCE)です。PGLeafにするには、探索ルーチンを書かないといけないです。 んで、今日はもう時間がないので続…

今日の予定

早くに帰って来れたんで、今日は少し開発する事にします。 …が、その前に復習も兼ねて*1将棋盤の各マスの表現方法について書いてみます。 まず、1マスの情報はsigned char型の変数一個に詰め込みます。実際のビット配置はこんな感じ。 7・6 5 4 3 2〜0 未使…

円安ゥ

http://www.univ2000.com/product/cstm.php?id=4f6d5aa4b22b3 この前書いたXeonデュアルマシンですが、値上がりしてます。 E5-2687W・RAM 128GB・SSD 120GBでキーボード・マウス無しの構成に変更して、¥800,520。約2.5万円の上げ幅です。 この調子だと、Ivy…

はすにゃ〜ん!!

http://www.gdm.or.jp/voices/2013/0511/29716 失礼。取り乱しました。 という訳で、Haswellは6月2日発売、6月4日発表ってスケジュールらしいですね。 DP以上のXeonはいまだにSandy Bridgeなので、これで2世代差がつく事になりますね。 これというのもAMDが…

とりあえず三目並べは完成

目標探査率を1%に設定すれば、自己対戦での引き分け率が100%になりました。 しばらく走らせてみましたが、特に異常は無いしアサーションにも引っかからないんで、多分ちゃんと動いているはずです。 という訳で、次の休みはリバーシ関連(局面クラスとか評価…

よし

今日中に三目並べの強化学習が動く所まで実装しよう。 …とか言ってる割には、ダラダラと昼過ぎまで寝てるのはどうにかしないと。 ……でも、そうでもしないと平日の疲れは抜けないしなぁ。

打ち歩詰め

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2013/05/09/wdoor+floodgate-900-0+Gasyou_Atom-D510_1c2t+sunflower_WCSC23+20130509220002.csa やっちゃってますよ〜、ひまわりさん〜〜 そういやGA将は一日6〜7回位打ち歩詰めをやった事がある様な気が… うん、…

続・入玉用評価項目のプラン

http://d.hatena.ne.jp/Gasyou/20130507/1367931096 王将のいる段より、王将が敵陣に進むまでのステップ数を基準にしてrankFactorから値を引いて来た方がいいかも。 あ、でもそれならrankFactorを廃止して、ステップ数ごとに重み付けすれば良いか。 うーん、…

VTuneの実習

http://www.xlsoft.com/jp/products/intel/tech/xetech/amplifier.html?s=0508 行ってみたいけど、時間とかお金とか色々足りない。 でも、パフォーマンス解析とかチューニングとかはほぼ我流でやってるから、いっぺんちゃんとした教育を受けたい所ではありま…

ふむ…

http://www.qualest.co.jp/contents/web2system/XE5QSV1.shtml 2.2GHz×8コア×4ソケットでメモリ128GB積んで140万か。 魅力的ではありますが、これはさすがに手が出ないですねぇ。 …頭金70万で残りを24回ローンだと月3万円前後の返済か。車買うつもりで購入可…

入玉用評価項目のプラン

現在のGA将の実装だと、自己対戦学習時に1%前後の割合で入玉で終局します。入玉しそうになって、それを阻止した対局も多少はあるはずです。 んで、それをムダにするのももったいないので入玉時の評価をきちんと出来る様にしたいです。 という訳でそれ用の評…

【王将将棋】ちょっと面白そうな遊びを思い付いた【駒割?なにそれ?】

後手の駒は普通の将棋のままで、先手の駒を全部王将にして*1強化学習で評価関数のパラメータ調整をやってみたらどうなるかな。 王将の価値を金よりやや高い程度と仮定しても、初期配置での駒割りは先手有利。 ただ、先手には駒の個性が無いのと大駒が無いか…

今年の方針

もう日付変わっちゃいましたが、一年の計は元旦にありという事で今年の方針をば。 まず、一気に複数の事に手を付けると収集つかなくなるので、やる事とやらない事を大雑把に。 【最優先でやる事】自己対戦の経験をもとにした評価関数パラメータの学習。 【最…

評価値の展開による局面評価の高速化

だれでもやってる当然の事かもしれませんが、軽くググってみても出て来なかったんで書いてみます。 まず、現在のGA将!!!!!!の駒割・絶対位置評価関連の評価項目は下記の通りです。 駒割(盤上の駒) 駒割(持ち駒) 筋・段個別の絶対位置評価 絶対位置評価 …

しばらくお休みします

floodgate参戦は新バージョン(GA将!!!!!!!)が動く様になるまでお休みという事で。 いつになるかなぁ、再参戦。夏までは忙しいから、早くて10月頃か? マズイ、半年たっちゃうよ。

WCSC23決勝

http://computer-shogi-live.cocolog-nifty.com/blog/2013/05/bonanza-9b04.html 保木さんのBonanzaが優勝したみたいですね。おめでとうございます。 運営・参加者・関係者の方々も3日間お疲れ様でした。ほとんど棋譜を見れてないですが、昼休みに中継を見て…

来年に向けてのプラン

PGLeafの実装 エージェント本体 4x4リバーシの局面クラス・評価関数・探索ルーチン 5五将棋・本将棋の局面クラス・評価関数・探索ルーチン ムーブオーダリングの改善 History HeuristicとSEEを組み合わせてみる 各種枝刈・探索の短縮 LMR null move pruning …

GA将!!!!!!は一次予選敗退だったらしい

今帰宅して知りました。 てか、あの出来で3勝出来るって方が驚きなんですが。 来年までには強化して、何とか二次予選進出を目指したいです。

今月から忙しいです

仕事が。 んで、忙しい期間とその間の収入(予測)からどんだけ貯金が貯まるか計算してみましたが、残業代だけでXeonデュアルマシンが買えそう。 http://www.univ2000.com/product/dtal.php?id=4f6d5aa4b22b3 E5-2687Wデュアルにメモリ128GB、120GBのSSDって…