過去最高の出来、かも
http://d.hatena.ne.jp/Gasyou/20150303/1425379246
昨日の棒銀を覚えた評価関数パラメータ+改良後の探索ルーチンでsspと連続対局。
結果、370-0-32で勝率92.0%、95%信頼区間は88.9〜94.5。
前回選手権時の評価関数パラメータだと勝率が84%だったので、レーティングは+140といった所でしょうか。
昨日はちゃんと書いていませんでしたが、学習はSR-PGLeafを使って自己対戦で行いました。
プロ棋士の棋譜や定跡等は一切使用せず、独自に棒銀を覚えた様です。
学習時の探索条件は全幅2手+静止探索で、枝刈りはLMRとFutility Pruningのみ使用しています。
さて、そんじゃぁ早速floodgateに投入…したいんですが、まずは並列探索のチューニングからやる予定です。
floodgateはRが安定するまでもう少し様子見です。