GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2014-02-01から1ヶ月間の記事一覧

今日の課題

適格度トレースっポイものを実装する予定。

まだまだデバッグ中

新アルゴリズムですが、どっかバグが有るらしくてアサーションに引っかかってました。 んで、再現出来なかったのでエラー発生時はSFEN形式で局面と指し手の履歴を出力する様に修正。 とりあえず、これで次回のバグ発生時は原因追求出来るかと。

独自アルゴリズムの実現のメドが立ってきました

前にもブログに書いたかもしれませんが、現在のGA将の学習ルーチンでは、勝ったら+1・負けたら-1の報酬を対局終了時に与えています。 で、これを適当に分割して、1手ごとに報酬を与えるってのを検討中です。ただし、1局通しての報酬の合計は+1か-1になる様に…

大須にGo!

学習用兼選手権用PCとして、Xeon E5-2630 v2(6コア・2.6GHz)デュアルでRAM64GBなマシンを組もうと思い、大須に下見に行ってきました。 んで、色々店を回った結果↓ 九十九電機:私「Xeonデュアルで組みたいんスけど。」店員さん「おk!メモリはECC付きでお…

対ssp(5五将棋モード)で勝率60%超えました

PGLeafで17万局ほど学習させたパラメータを使用。 んで、全幅+静止探索だと26-0-28*1で勝率48.1%。これにLMRを加えたら69-0-37で勝率65.1%になりました。 ちなみに評価項目はこんな感じ。 駒割 駒の絶対位置評価 二駒の相対位置評価 駒の自由度 王将の移動…

ボチボチ進んでます

とりあえずPGLeafで学習させつつ、並行して合議PGLeafのデバッグとか評価項目の追加とか。 んで、二駒絶対評価と三駒相対評価を実装して、ザクッとパラメータ数を数えると…全部入りで250万個… 学習用マシンの同時実行可能なスレッド数次第ですが、ひょっとし…

よし

http://wdoor.c.u-tokyo.ac.jp/shogi/view/2014/02/06/wdoor+floodgate-900-0+gps500+Gasyou_Atom-D510_1c2t+20140206233001.csa gps500に勝ったことだし、気分良いうちにサクッと寝ますか。