2008-12-19 今度は成功 開発日記 王手将棋で方策はソフトマックス、評価関数は先後非対称の絶対位置評価のみって条件だと、ソフトマックスの温度次第ではちゃんと収束する様です。 ただ、方策をεグリーディーにしたり、評価関数で駒割とか先後対称の絶対位置評価とかの(今の対局条件では)余分な評価項目があったりとか、そういう場合のデータと比較しないと話にならないんで、とりあえずは色々実験してみます。 という訳で、まずは評価項目を増やして実験。二駒の相対位置関係とか王将の移動可能な範囲とか、計算に時間がかかるもの以外を追加してみます。