ここ一週間ほどの進捗等
学習ルーチンを色々いじってみたのものの、結局今年1月2日に対ssp勝率75.6%を記録したのを超えられませんでした。
んで、現在はその最高記録達成時の設定に戻して再度学習中。多分、これがUEC杯に向けての最後のお願いになるはず。
それから、思考時間制御関連のデータ収集&分析は完了。こっちは単純作業なんで順調に行きました。試しに20局ほど20分切れ負けでsspとスパーリングしましたが、10~15分程度で終局するみたいなんで、まぁ悪くない感じかと。
最後に、探索ルーチンの改良。今更Stockfishを真似ても面白くないんで、実現確率探索&遷移確率の学習ルーチンを実装して色々やってます。
軽く1時間ほど走らせた結果、0.17秒で10~15手ほど*1読める様になりましたが、その割にはあんまし強くなってない印象。どっかで読み抜けしてるんでしょうねぇ。
という訳で、「ほぼ進展無し」ってのが総括でしょうか。