2009-12-18から1日間の記事一覧
評価項目全部入り UCT方策+ソフトマックス方策 目標探査回数2回 探索は全幅1手+静止探索4手 さて、上手く行くのかどうか。
新バージョンで学習したパラメータ+新バージョンプログラムで連続対戦。 結果、164-2-186で勝率46.9%、95%信頼区間は41.5〜52.2。 旧バージョンで学習した場合より20ポイントほど勝率低いですね。うーん。 まぁ、評価項目増やせば強くなるかもしれません…
評価項目全部入り UCT方策+ソフトマックス方策 目標探査回数2回 探索は全幅1手+静止探索4手 さて、上手く行くのかどうか。
新バージョンで学習したパラメータ+新バージョンプログラムで連続対戦。 結果、164-2-186で勝率46.9%、95%信頼区間は41.5〜52.2。 旧バージョンで学習した場合より20ポイントほど勝率低いですね。うーん。 まぁ、評価項目増やせば強くなるかもしれません…