GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

三目並べ・リバーシ用にコード再修正

 新バージョンのコードは、もともと三目もリバーシも動く様になってたんですが、将棋用に色々修正した*1結果、三目・リバーシ用のモードではコンパイル不可能になっていました。

 そこで、今日は将棋固有の処理をちゃんと切り分けたり*2して、三目・リバーシでも動く様に修正。

 実際に動かしてみると割と面白い事が分かったりして、例えばソフトマックス方策の温度の初期値は思い切って高め*3にすると、そっちのほうが学習の収束が速かったりしました。

 という訳で、旧バージョンの将棋でも温度の初期値を高めにして、学習用マシンに投入。ちょっとは強くなってくれると嬉しいです。

*1:自殺手を無視するルーチン追加とか

*2:プリプロセッサを使って、将棋モードの時だけ有効になる様にしたりとか

*3:0.05がベストの場合にあえて1.0とか