GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

探索深さを色々変えて実験中

 方策勾配法+ソフトマックス方策+αβ探索で4x4のリバーシを先手のみ学習中。

 んで、探索深さと最適方策との誤差の関係を測定してるんですが、何か変な現象が。深さ4〜5で一旦誤差が1を切って、深さ6だと今度は誤差が8に増えてます。

 テストが10,000局*10セットなんで、セット数が少ないのがバラつく原因かと思い、今度は100セットに変更して測定中。

 ただ、時間がかかるんで結果が出揃うのは明日になりそうです。