探索深さを色々変えて実験中
方策勾配法+ソフトマックス方策+αβ探索で4x4のリバーシを先手のみ学習中。
んで、探索深さと最適方策との誤差の関係を測定してるんですが、何か変な現象が。深さ4〜5で一旦誤差が1を切って、深さ6だと今度は誤差が8に増えてます。
テストが10,000局*10セットなんで、セット数が少ないのがバラつく原因かと思い、今度は100セットに変更して測定中。
ただ、時間がかかるんで結果が出揃うのは明日になりそうです。
方策勾配法+ソフトマックス方策+αβ探索で4x4のリバーシを先手のみ学習中。
んで、探索深さと最適方策との誤差の関係を測定してるんですが、何か変な現象が。深さ4〜5で一旦誤差が1を切って、深さ6だと今度は誤差が8に増えてます。
テストが10,000局*10セットなんで、セット数が少ないのがバラつく原因かと思い、今度は100セットに変更して測定中。
ただ、時間がかかるんで結果が出揃うのは明日になりそうです。