GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

結局、将棋用にTDLeaf(λ)+カーネル法評価関数を実装する事にしました

 どのみち後で欲しくなる可能性高いですし、将棋で学習ルーチンを2つ*1使えた方がメリット大きいので。

 んで、とりあえず新規に評価関数クラスを作ってポチポチと実装中。局面を元に低次元の特徴量を計算する部分がまだですが、それ以外は完成しました。

 まぁ、ほとんどの処理はリバーシカーネル法評価関数と同じなんで、大して手間はかかってないんですが。

*1:TDLeaf(λ)と方策勾配法