GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2014-09-01から1ヶ月間の記事一覧

Softmax実現確率探索 まだデバッグ中

先手と後手で探索ルーチンを分け、後手のパラメータは初期値(極めて小さい乱数)に固定・先手のパラメータのみ学習って条件で連続対戦中。 んで、先手の勝率は70%を越える位まで一旦上昇し、その後下降します。 つー訳で、バグの可能性が高いんで何とかしま…

Softmax実現確率探索 もうちょっとで完成?

Softmax実現確率探索ですが、ある程度はちゃんと学習が進む様になりました。 具体的には、5五将棋でssp相手に271-?-61で勝率81.6%、95%信頼区間が77.0〜85.6。 多分、「全幅探索ベースで前向き枝刈りはLMRのみ」の場合と同じ位の強さです。 んで、今日は着…

電王トーナメントの宿確保

大宮駅前のパークプラザ大宮という所にしました。 会場に近いし、安かったんで。 さて、後は一ヶ月前になったら行きの夜行バスを予約しておけばOKかな。

オンメモリプロセッサという妄想

コーディングしてると時々出てくるのが、メモリアクセスがボトルネックになる現象。 んで、これってメモリ上(か、メモリモジュール上)にシンプルなプロセッサ*1を載せれば解決しないかなぁ、と時々思います。 例えばdouble型の1次元配列が2つあって、内積…

ひどい逆転負けしてる

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2014/09/16/wdoor+floodgate-900-0+Gasyou_Athlon-5350_4c+Bonanza6.0_Depth5+20140916233005.csa 秒読みモードになった途端評価値が急落… これは、何かバグってるのかなぁ?

最寄り駅→大宮の夜行バスが6千円台である。これは使えるかも。

Softmax実現確率探索 相変わらず実装中

試しに自己対戦の一棋譜だけを対象に学習させるモードを実装。 んで、走らせてみると最善手以外の遷移確率が上昇していくという変な現象が。 明らかにバグなんですが、学習則が複雑なのでどこがバグってるかサッパリです。 …いっぺん、学習部分をシンプルに…

Amazonでポチった

デバッグの理論と実践 ―なぜプログラムはうまく動かないのか作者: Andreas Zeller,中田秀基,今田昌宏,大岩尚宏,竹田香苗,宮原久美子,宗形紗織出版社/メーカー: オライリージャパン発売日: 2012/12/22メディア: 大型本購入: 4人 クリック: 184回この商品を含…

Softmax実現確率探索 まだまだ実装中

遷移確率でオーダリングした時の最善手の位置が、平均3手目までは下がる様になりました。 が、一旦3手前後まで下がった後6〜7手まで上昇するって現象が発生。 始めはどっかの変数の初期化漏れとかを疑っていたんですが、プロセスを殺してから再度走らせても…

Softmax実現確率探索 まだ実装中

おかしい、下がるはずの値が全然下がらない… 実装が間違ってるのか、アルゴリズムの問題か、それともメタパラメータの設定か。怪しい所が色々あるので、どうしたもんかな。

Softmax実現確率探索 実装中

とりあえず探索して、着手評価関数の勾配を計算するのに必要なデータを収集する所までは実装完了。 んで、パラメータ更新部分が以前のバグ持ちバージョンなので、明日にはそこを修正予定。 とりあえず、アサーション有効にして一晩走らせてみます。

コードを発掘

http://d.hatena.ne.jp/Gasyou/20140907/1410080790 で書いたコードを発見しました。 やっぱ、ソースの履歴に適切にコメント付けとかないと、いざという時困りますね。 さて、それでは開発に着手しますか。

あれ? コードをロストした?

以前書いた(と思う)コードをソースの履歴から探してるんですが、発見出来ず。 えと、あれをもう一回書くのは骨が折れるんで、何とか探し出したいけど、どうすれば良いんだろう…

Softmax実現確率探索のパラメータ学習

パラメータ学習ルーチンの実装に着手。 と言っても、半分位は既存のルーチンの流用なんで、コピペして少しだけ修正しました。 とりあえずMinMax探索部分は書いたんで、後はパラメータ修正する所とかその辺を書けばいいだけ。 土日あれば一通りの実装は出来る…

色々あって、Softmax実現確率探索の学習にリトライ

まずは三週間、みっちり実装してみます。 あ、そういや5月に立てた計画、完全にスケジュール無視した進行になってますね。 ま、いつもの事です。いつもの。