GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2013-08-17から1日間の記事一覧

よし、修正完了

1エージェントでザックリ動かした感じだと、修正前より収束が早くなってる感じです。 という訳で10エージェントで大まかな結果を出して、そっから分散系数を絞り込んで一晩走らせますか。

あ、上の結果間違ってた

ノイズの更新をするタイミングがおかしかったです。 という訳で今から修正&データとり直し。寝るまでに9通りの結果、出せるかな?

と、いう訳で

新アルゴリズム*1のノイズ付加探査を実装&軽く動作確認も兼ねてテスト。 んで、結果です ↓(クリックで拡大) 4x4リバーシで、探索深さ3手で学習した評価関数と、完全読みプレイヤーを対局させた結果です。 学習は各設定(分散系数)で乱数のシードを変えつ…

結局

上記の問題は「リバーシ用評価関数の精度不足」って結論になりました。 リバーシでは初手は4手あるのですが、どの手を指しても対称な形になります。 で、4手全ての価値を正しく評価するには、評価関数の精度が不足してるのではというのが現在の考えです。 つ…

状況の整理

アサーションに引っかからないので、配列の領域オーバーアクセスとかっていう単純なバグでは無さそう。 それと、対局数を増やしても探索深さ1の後手はNGだったので、収束が遅いって線も消えた。 となると、PGLeafエージェントで後手特有の処理をしている部分…

4x4リバーシで実験中

エージェント数1での完全読みプレイヤー相手の結果。 探索深さ1:先手のみOK 探索深さ2:先後とも大体OK(ただし、先手はやや不安定) 探索深さ3:先後ともOK 探索深さ4:先後ともOK 探索深さ5:先後とも大体OK(ただし、先手は深さ2より不安定) つまり…どういう…