GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

評価項目の自動生成

私の棋力が低いため、ヒューリスティックな項目では作れそうにありません・・。また、パターンを正しく認識できたら、ヒューリスティックな項目も多分に含まれるものと思っています。

http://d.hatena.ne.jp/SeleneShogi/20120314/p1

 私も同じ理由でパターン的な項目をメインにしています。

 で、パターン的な項目を突き詰めていくと以前書いた多項式カーネルを使った評価関数になるんじゃないかと思っています。これがえらく強力だった*1ので、出来る事ならコンピュータ将棋にも応用したい所です。

 …問題は評価値計算速度で、全幅3手+静止探索4手とかで探索すると、25分切れ負けでまともに指せない(中盤で時間切れ負けになる)って事なんですが。

ランダムに作成して勝手に学習して最適なものを見つけてほしいんですけど^^;

http://d.hatena.ne.jp/SeleneShogi/20120314/p1

 これも課題の一つですが、難しいですよねぇ。駒割位は学習出来た事がありますが、他は… _| ̄|○です。

 楽をするならBonanzaの評価関数を流用して、fv.binを初期値として学習…って、それは芝浦将棋さんが既にやってる事ですし…

 私の感触だと、自己対戦での評価関数のパラメータ学習には「あと一つ何か」が足りないだけなんですが、それがなにかサッパリ分かりません。それを見つけた人が頭ひとつリードするんでしょうが、何なんでしょうねぇ、いったい。

*1:リバーシ用に石の位置・色や辺のパターンetcを使った評価関数を、単純なカーネル法評価関数が簡単に上回った