2011-08-29 昨夜から走らせた結果 開発日記 テーブル形式の評価関数で先手だけ学習しても、ちゃんとした結果にはなりませんでした。 ログを見てると平均報酬とベースラインの関係がおかしい*1ので、その辺を一度調べてみます。 *1:相関係数が低い