2012-03-18から1日間の記事一覧
シングルクライアントでの方策勾配法をもうちょっと頑張ってみるか、合議+方策勾配法の方を先行してやるかで悩んでます。 どっちもそれぞれ問題が有りそうな感じなんで、どっから手を付けたもんかなぁ…
今年度バージョンの概要 強化学習の一手法である方策勾配法を用いて評価関数パラメータの学習を行う。 評価項目は駒割・駒の位置評価+細々としたものいくつか。 探索は普通にαβ探索で全幅(LMRあり)+二段階静止探索。 詰将棋ルーチンも一応あります。 複…
多分ですけど、Windows Updateで何らかの変更があり、多分それが原因でデバッグ時に呼出履歴に関数名が表示されない*1状態になっていました。ついでに、VTuneも同じ状態。 んで、色々やった結果、3月のWindows Updateパッチをアンインストールすると、デバッ…