GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-12-18から1日間の記事一覧

学習用マシンに新バージョンを投入

評価項目全部入り UCT方策+ソフトマックス方策 目標探査回数2回 探索は全幅1手+静止探索4手 さて、上手く行くのかどうか。

新バージョン vs ssp

新バージョンで学習したパラメータ+新バージョンプログラムで連続対戦。 結果、164-2-186で勝率46.9%、95%信頼区間は41.5〜52.2。 旧バージョンで学習した場合より20ポイントほど勝率低いですね。うーん。 まぁ、評価項目増やせば強くなるかもしれません…