GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-01-22から1日間の記事一覧

とりあえず王手将棋でのやり残し終わらせました

先後入れ替えてもちゃんと収束。ある程度有望そうな温度でざっと動かしただけですが、多分大丈夫でしょう。 んで、上のTODOには反映済み。 今日はGPWの論文集とか色々読みたいんで、コーディングはもう終了にしときます。

CSA MLの件というかプログラム名の件というか

勝手に転載するとダメでしょうから伏せ字で書きますけど、I藤さんとかY本さんとか、ソフト名が面白すぎるんですけど! これは、私も何か面白くてインパクトのある名前を考えざるを得ないじゃないですか。

プラン再構築

将棋の学習関連 TDLeaf(λ)エージェントを再実装。 方策をエージェントから独立させる。 学習中の各種統計情報の収集・表示ルーチン実装。 std::vectorあたりを勉強しとくこと。 王手将棋での予備実験。 εグリーディーとソフトマックス手法の比較。 評価関数…

一晩動かした結果

エラーとかアサーションに引っかかったとかはなく、とりあえず動いてました。 対局数は20.5時間で1800局なので、24時間で2100局ペース。ただし、評価関数で一部の評価項目を無効にしているので、その辺は割引いて考える必要はありますが。 目標対局数を24時…