K55の学習方式、真似てみようかなぁ
http://homepage2.nifty.com/kakinoki_y/free/55shogi.pdf
基本的な話は講演会で聞いてきたので、(全く同一のアルゴリズムになるかは置いといて)実装は出来るはず。
ボナンザメソッドも簡易版*1を実装してあるし、手持ちのクラス+αで出来るはず。
問題は学習速度で、5五将棋はともかく、本将棋だとどうなるか。
仮に1手平均5秒考えるとすると、一局100手として500秒(≒8分)、一日あたり170局前後になります。
収束までどの程度の局数がかかるか不明なんで、まずは実装してみないと始まりませんが、対局数稼いで学習率が低いのをごまかせないってのはちと不安。
まぁ、とりあえずは今あるクラスの機能を見なおして、一晩かけて頭ん中で設計。明日から実装しましょう。
*1:ペナルティ等が無い