Stockfish風探索ルーチンでの学習開始
自己対戦学習時にStockfish風探索ルーチンを使える様にして、とりあえず深さ5手で学習開始。
5五将棋だと、24時間で110万局ペースになりました。速い! 前(αβ全幅時)は3手読みで50万局でした。
あ、探索パラメータはStockfishの謎数字のままです。手調整は偉大だ、という事で。
んで、現状は自己対戦にしか使えないので、学習させてる間にUSIでの対局時も同じ探索ルーチンを使える様に修正します。
今は思考時間による打ち切りとかPonderとかに対応していないので、その辺をちゃんと実装しないと。