うーん、そんなに悪くないよなぁ - GA将？開発日記～王理のその先へ～

23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 終局図
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |^杏|   |v銀|^飛|   |^龍|v銀|   |   |
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |   |   |v金|v桂|   |v王|v金|v角|   |
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |^歩|v歩|v歩|v歩|v歩|v歩|v桂|v歩|   |
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |   |^歩|   |   |   |   |   |   |   |
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |   |   |   |   |   |   |   |   |v香|
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |v香|   |   |   |   |   |   |   |^歩|
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |^桂|   |^歩|^歩|^歩|^歩|^歩|^歩|   |
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |   |   |   |^銀|^金|^銀|^金|   |   |
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |   |   |^角|   |^王|   |^桂|   |vと|
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 歩,香,桂,銀,金,角,飛
23:09:38 @ core::rl::PolicyGradientAgent::playGame() >  2, 0, 0, 0, 0, 0, 0,
23:09:38 @ core::rl::PolicyGradientAgent::playGame() >  0, 1, 0, 0, 0, 0, 0,
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 手番:後手
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 手数:120

　先手玉は上からの攻めにはちゃんと対応出来る様になってるし、自分が相手するなら結構苦労しそうな感じ。

　学習する場合、「何も出来ない状態から、稚拙ながらも少し出来る状態」にするのが難しくて、「少し出来る状態から、高度に出来る様にする」のは比較的簡単な感じがするので、後もうちょっとなんだと思いますが。

　ただ、今のルーチンだと終盤の学習が全く出来ないので、囲う事は出来ても上手に攻めるのは無理っぽいです。

　うーん、何が原因なのかなぁ・・・