リバーシで関数近似を実装
今まで4x4のリバーシはテーブル形式の評価関数でやってたんですが、それじゃぁあんまりテストにならないんで、線形+シグモイドの評価関数も実装。現在テスト中。
後は学習中のパラメータの変化を出力する様にして、将棋同様に発散するかどうかの調査ですね。もう眠いんで、続きは明日にします。
今まで4x4のリバーシはテーブル形式の評価関数でやってたんですが、それじゃぁあんまりテストにならないんで、線形+シグモイドの評価関数も実装。現在テスト中。
後は学習中のパラメータの変化を出力する様にして、将棋同様に発散するかどうかの調査ですね。もう眠いんで、続きは明日にします。