昨夜の実験は一応成功
先後非対称の評価関数にしたのが良かったみたいです。
んで、ソフトマックス手法ではボルツマン分布に従って手の選択確率を決めているのですが、温度というパラメータを決める必要があります。
昨夜のバージョンは温度を徐々に下げていたのですが、温度固定ではどうなるかを一晩試してみます。詳しい検討は明日データが出そろってからします。
先後非対称の評価関数にしたのが良かったみたいです。
んで、ソフトマックス手法ではボルツマン分布に従って手の選択確率を決めているのですが、温度というパラメータを決める必要があります。
昨夜のバージョンは温度を徐々に下げていたのですが、温度固定ではどうなるかを一晩試してみます。詳しい検討は明日データが出そろってからします。