うーん、そんなに悪くないよなぁ
23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 終局図 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |^杏| |v銀|^飛| |^龍|v銀| | | 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > | | |v金|v桂| |v王|v金|v角| | 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |^歩|v歩|v歩|v歩|v歩|v歩|v桂|v歩| | 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > | |^歩| | | | | | | | 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > | | | | | | | | |v香| 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |v香| | | | | | | |^歩| 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > |^桂| |^歩|^歩|^歩|^歩|^歩|^歩| | 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > | | | |^銀|^金|^銀|^金| | | 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > | | |^角| |^王| |^桂| |vと| 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > +---+---+---+---+---+---+---+---+---+ 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 歩,香,桂,銀,金,角,飛 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 2, 0, 0, 0, 0, 0, 0, 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 0, 1, 0, 0, 0, 0, 0, 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 手番:後手 23:09:38 @ core::rl::PolicyGradientAgent::playGame() > 手数:120
先手玉は上からの攻めにはちゃんと対応出来る様になってるし、自分が相手するなら結構苦労しそうな感じ。
学習する場合、「何も出来ない状態から、稚拙ながらも少し出来る状態」にするのが難しくて、「少し出来る状態から、高度に出来る様にする」のは比較的簡単な感じがするので、後もうちょっとなんだと思いますが。
ただ、今のルーチンだと終盤の学習が全く出来ないので、囲う事は出来ても上手に攻めるのは無理っぽいです。
うーん、何が原因なのかなぁ・・・