GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2015-06-06から1日間の記事一覧

探索ルーチンのリファクタリングは中断

強化学習関連でやってみたい事が出来たんで、そっちを優先します。 んで、何をするかと言うと、自己対局時に「あまり学習していないパラメータが出て来た局面を優先的に選ぶ」というものです。 今までの自己対局では「評価値が高い手ほど高確率で選ぶ」様に…