2015-02-27 うん、上々 開発日記 「前回選手権時の評価関数パラメータ+探索パラメータを手調整での改良版探索ルーチン」での連続対局ですが、結局ssp(本将棋モード)相手に323-0-51で勝率86.4%、95%信頼区間は82.5〜89.7になりました。 81%の確率で以前の探索ルーチンより強くなってるみたいなので、当面はこのルーチンをベースに並列化していきます。 さて、それじゃぁ今度は評価関数を差し替えてみますか。全幅2手+静止探索で27万局ほど学習したのがあるので、まずはそれを試してみます。