TreeStrap(minimax)半分くらい実装完了

開発日記

論文のアルゴリズムそのままだと実装に時間がかかりそうだったので、探索しながら内部ノードでいきなりパラメータ更新する*1っていう手抜きコードで実装。取り敢えず動く様になりました。あ、それから時間制御もFischer time controlsではなく、一手2秒固定…

TreeStrap(αβ)って、floodgateで学習するにはいいかも

開発日記

1000局で収束するって事は、3週間で終わるって事ですよね。おまけに、ほとんどの相手は自分より強くて、棋風も色々で、持ち時間もたっぷり。良い事ずくめ。うーん、選手権終わったらやってみるか？

開発日記

search treeって静止探索部分も含むのか？含まないのか？流石に静止探索内で評価値のバックアップするのはやりすぎな気がするから、含まないものとして実装しておこう。でも本当はどっちなんだろう・・・気になる。

開発日記

なんでいきなりTreeStrap(αβ)を実装しないかと言うと minimaxの方を練習＆プロトタイプとして使いたいアルゴリズムがシンプルなので、取っ掛かりとしては良さげ minimaxでもTDLeaf(λ)より性能が良い（と論文には書いてあった）てな感じです。今日中に動作…