GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

探索深さを色々変えて実験中

開発日記

　方策勾配法+ソフトマックス方策+αβ探索で4x4のリバーシを先手のみ学習中。

　んで、探索深さと最適方策との誤差の関係を測定してるんですが、何か変な現象が。深さ4〜5で一旦誤差が1を切って、深さ6だと今度は誤差が8に増えてます。

　テストが10,000局*10セットなんで、セット数が少ないのがバラつく原因かと思い、今度は100セットに変更して測定中。

　ただ、時間がかかるんで結果が出揃うのは明日になりそうです。