昨夜からの連続対局の結果
GA将のVer.5(最新版)とVer.4(WCSC20版)で、マシンも2種類。
バージョン | CPU | 勝敗 | 勝率 | 95%信頼区間 |
---|---|---|---|---|
5.1(1並列) | Core i7 940 | 203-5-137 | 59.7 | 54.3〜65.0 |
4.0(2並列) | 同上 | 169-1-151 | 52.8 | 47.2〜58.4 |
4.0(2並列) | Core 2 Duo P8600 | 236-2-133 | 64.0 | 58.8〜68.9 |
多少幅はありますが、概ね60%前後みたいですね。
Ver 4.0でCore i7の勝率が低いのは、スレッドのアフィニティマスクを1と2にしていた為、同じ物理コア上の2つの論理コアを使う事になって性能が下がったんじゃないかと。
5.1の方が探索をいじるには都合が良いので、これをベースに多少改良して選手権に臨む予定。
ちなみに5.1を4クライアントで合議して弱くなったのは、多分評価関数の作り方が適当すぎたから。
もともと評価項目全部ありで学習したパラメータを使って、それぞれ異なる一部評価項目を無効にして複数の評価関数を作っていたので、棋風に差が出はしたけど極端に精度の低い評価関数も混じっていたんじゃないかと。
という訳で、複数評価関数で合議をするのは、それ用の学習ルーチンをちゃんと作ってからにしたいと思います。