2010-04-11から1日間の記事一覧
論文のアルゴリズムそのままだと実装に時間がかかりそうだったので、探索しながら内部ノードでいきなりパラメータ更新する*1っていう手抜きコードで実装。取り敢えず動く様になりました。 あ、それから時間制御もFischer time controlsではなく、一手2秒固定…
1000局で収束するって事は、3週間で終わるって事ですよね。 おまけに、ほとんどの相手は自分より強くて、棋風も色々で、持ち時間もたっぷり。良い事ずくめ。 うーん、選手権終わったらやってみるか?
search treeって静止探索部分も含むのか? 含まないのか? 流石に静止探索内で評価値のバックアップするのはやりすぎな気がするから、含まないものとして実装しておこう。 でも本当はどっちなんだろう・・・気になる。
なんでいきなりTreeStrap(αβ)を実装しないかと言うと minimaxの方を練習&プロトタイプとして使いたい アルゴリズムがシンプルなので、取っ掛かりとしては良さげ minimaxでもTDLeaf(λ)より性能が良い(と論文には書いてあった) てな感じです。 今日中に動作…