2009-01-22から1日間の記事一覧
先後入れ替えてもちゃんと収束。ある程度有望そうな温度でざっと動かしただけですが、多分大丈夫でしょう。 んで、上のTODOには反映済み。 今日はGPWの論文集とか色々読みたいんで、コーディングはもう終了にしときます。
勝手に転載するとダメでしょうから伏せ字で書きますけど、I藤さんとかY本さんとか、ソフト名が面白すぎるんですけど! これは、私も何か面白くてインパクトのある名前を考えざるを得ないじゃないですか。
将棋の学習関連 TDLeaf(λ)エージェントを再実装。 方策をエージェントから独立させる。 学習中の各種統計情報の収集・表示ルーチン実装。 std::vectorあたりを勉強しとくこと。 王手将棋での予備実験。 εグリーディーとソフトマックス手法の比較。 評価関数…
エラーとかアサーションに引っかかったとかはなく、とりあえず動いてました。 対局数は20.5時間で1800局なので、24時間で2100局ペース。ただし、評価関数で一部の評価項目を無効にしているので、その辺は割引いて考える必要はありますが。 目標対局数を24時…