GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

二駒絶対を外すと弱くなる

 らしいので、16クライアントでの合議を一旦8クライアントに変更してみます。(二駒絶対は全クライアントで有効で、それ以外の3項目の有効・無効で8クライアント作る。)

 大雑把にテストして、現在はアサーション有効でテストラン中。

 1000局経過してパラメータを更新してもアサーションに引っかからなければ、学習用マシンに投入かな。

ちょwおまwwww

 8クライアントのバージョンを学習用マシンに投入完了。

 んで、NPSが600k→800kにアップし、24時間あたりの対局数は1千万→2千万に向上。PVの検証ルーチンを外した効果ですかね。

 とりあえず、日曜夜辺りに1億局突破しそうなんで、まずはそこまで辛抱強く待ってみます。

囲いの駒の評価をリトライ

 第25回選手権バージョンのGA将!!!!!!!!の弱点の一つは「ちゃんと囲えない」事なので、そこをなんとかしようかと。

 んで、まず囲いの駒の認識方法は以前書いたものでそこそこの精度が出そうなので、それを流用。

 次に、認識した「囲い」の評価方法。以前は駒の種類・枚数等だけだったから失敗しましたので、「特徴の生成を組み合わせた機械学習」@GPW 2011の方法でやってみようかと思います。

 それから、単純に「全ての囲いの駒」を対象に評価すると、一歩の有る無しでガラッと評価が変わりそうなので、「重ね合わせによるデータ構造を用いた評価関数の学習」@GPW 2008も一緒に使ってみようと思います。

 ただ、未解決の実装上の問題があるので、まずはそれをどうにかしないと。

うん、やっぱり思考の転換が必要かも

 http://d.hatena.ne.jp/Gasyou/20150510/1431217464 で書いた「複数評価関数での合議」ですが、評価項目の有効・無効の設定方法は一考の余地あり、って感じです。

 一昨日は単純に「評価項目の重いやつを上から4つ」選んで、それらを切り替えて複数評価関数を生成しようと考えていました。

 が、上で書いた様に二駒絶対を外すといきなり弱くなります。

 という訳で「棋力の底上げの為の評価項目」と「棋風を変化させる為の評価項目」に分けて考える必要がありそうですね。

 二駒絶対は前者、王将の移動可能範囲は多分後者…だと思う。

 となると、囲いの駒の評価は前者になるのかな? これは、実装してテストしてみるしか無いですね。