GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2013-08-16から1日間の記事一覧

デバッグ中

酒飲みつつデバッグしてます。 んで、現時点で怪しい部分を怪しい順に。 PGLeafエージェント 評価関数 探索ルーチン エージェントのバグなら将棋にも影響があるでしょうから、ここのバグなら今後に期待出来ます。 評価関数・探索部分のバグだとガッカリです…

とりあえず1エージェントで時間をかければ収束する様にしたい

んで、探索深さを1,2,3...と変化させると、片側のプレイヤーだけ正しく収束するっていう現象が起きてます。先手だけだったり後手だけだったり。 ん〜、何なんでしょうね、これは?

なんか、バグっぽい

4x4リバーシをPGLeafで学習させながら、完全読みプレイヤー相手の対局結果をログに出してみました。 んで、1エージェントの場合は先手・後手共に対局結果が最善(後手8石差勝ち)になるのですが1エージェントの場合でも、10エージェントや100エージェントの…

上で書いた件

まずは状況の把握。それから対応。 んで、現在はパラメータの更新回数と更新量の関係のログを取得中。もうすぐ終わるので、終わったらすぐ分析。 対応方法ですが、自己対戦にある程度のランダムさを加えてやれば解決しそうな気がするんで、その方法であって…

なんかおかしいなぁ…

多分二駒相対の評価を入れてからなんだけど、序盤から評価値が1000を越える*1事が多くなった気がします。 それと、棋力的にもsspに1割程度しか勝てなくなってたりとか、どっかおかしい感じ。まぁ、こっちは自己対戦の対局数が少なくて、まだ収束していないだ…