お久しぶりです
森岡です。一応、生きていました。
んで、タイトル(の後ろ)に書きましたが、ポリシー、捨てようかなぁと検討中。
今までは「プロ棋士の棋譜を使わずに学習」ってのに拘ってましたが、そこを方向転換。
つっても、今更教師あり学習に転向したんじゃ10年分周回遅れな訳で、とてもじゃないですがロクな結果にならないと思います。
てな訳で、「プロ棋士の棋譜から学習した、他の思考エンジンから学習」って方向に転換予定。
具体的に言うと、強化学習(PGLeaf)使うのは今まで通りで、対局相手を他のエンジン*1に置き換えようかと考えています。
プロセス間通信用のクラスは以前の*2を使い回せるので、難易度は低め・工数はそこそこッて感じかと思います。
*1:ライブラリ登録されてるものに限定した方が良いかな?