2012-04-09 うーん… 開発日記 学習経過 昨夜からの対sspの連続対戦は、23-4-473で勝率4.6%。問題外に弱いですね。 こうなりゃ、ネタに走って入玉を目指すコンピュータ将棋にしてみますか。 一応「棋譜からの学習が困難な状況下でも、自己対戦での強化学習は上手く行きました」っていう言い訳も出来ますし。 えっと、そうすると評価関数にも多少手を入れる必要があるかな? 入玉宣言側のプレイヤーの点数と敵陣にいる駒の数に応じて、評価値加算する様なロジックで行ける…はず。