GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2011-11-12から1日間の記事一覧

リバーシでカーネル法評価関数を実装開始

の前に、元の評価関数でテスト。条件は下記の通り。 4x4リバーシ TD(λ) ソフトマックス方策 初期温度10.0 テーブル形式評価関数 学習率0.5 結果はこうなりました。 学習条件 結果 収束までの対局数 先後とも学習 ○(-8) 約1万3千局 先手のみ学習 ×(+10) 約2千…

王手千日手の原因

詰将棋ルーチンでグローバル詰みテーブル参照→千日手・王手千日手チェックの順番になってたのが悪いかと思い、ここの順番を逆にしました。 αβ探索では以前に順番入れ替えたんですが、その時に考慮漏れがあってこっちの順番は入れ替えてなかったみたいですね…