2012-04-22から1日間の記事一覧
元々はこんな感じで、内部ノードの探索開始時にグローバル詰みテーブルのデータを読み込んでました。 double Searcher::searchNegaMax( Position *const position, ... ) { // グローバル詰みテーブル読み込み const int mateInfo = globalMateTable->get( p…
報酬へのボーナスの量と勝敗の関係は下記の通りとなりました。 駒の前進ボーナス 囲いの駒ボーナス 勝敗 0.01 0.02 4-0-1 0.03 0.02 17-0-3 0.09 0.02 20-0-0 0.01 0.04 20-0-0 0.03 0.04 18-0-2 0.09 0.04 19-0-1 20連勝した2つのパラメータは、ボーナスの…
王将付近に桂馬・香車・歩がいた時も金銀よりやや少なめに報酬を与える様に変更しました。 で、パラメータ6種類で約3万5千局ほど学習させたやつをLesserkaiと連続対局中。学習率は0.01に設定しました。 まだ収束していない可能性はありますが、とりあえずざ…
無敵囲いモドキですがw 一応、報酬の与え方を変更したのが効いてるのかな?
まだ先は長い? せめて、gps500には追いつきたいなぁ…