2013-01-29から1日間の記事一覧
この前からやってた、1局の自己対戦棋譜にオーバーフィッティングさせるテストの件。 まず、5五将棋で勝った側のみ、あるいは負けた側のみの学習だと、一致率がそれぞれ1.0、0.0に収束します。(探索は使わずに、素のREINFORCEで学習した場合。) ただ、両方…
この前からやってた、1局の自己対戦棋譜にオーバーフィッティングさせるテストの件。 まず、5五将棋で勝った側のみ、あるいは負けた側のみの学習だと、一致率がそれぞれ1.0、0.0に収束します。(探索は使わずに、素のREINFORCEで学習した場合。) ただ、両方…