GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2010-04-11から1日間の記事一覧

TreeStrap(minimax)半分くらい実装完了

論文のアルゴリズムそのままだと実装に時間がかかりそうだったので、探索しながら内部ノードでいきなりパラメータ更新する*1っていう手抜きコードで実装。取り敢えず動く様になりました。 あ、それから時間制御もFischer time controlsではなく、一手2秒固定…

TreeStrap(αβ)って、floodgateで学習するにはいいかも

1000局で収束するって事は、3週間で終わるって事ですよね。 おまけに、ほとんどの相手は自分より強くて、棋風も色々で、持ち時間もたっぷり。良い事ずくめ。 うーん、選手権終わったらやってみるか?

TreeStrap(minimax)でいきなりつまづく

search treeって静止探索部分も含むのか? 含まないのか? 流石に静止探索内で評価値のバックアップするのはやりすぎな気がするから、含まないものとして実装しておこう。 でも本当はどっちなんだろう・・・気になる。

今からTreeStrap(minimax)を実装してみます

なんでいきなりTreeStrap(αβ)を実装しないかと言うと minimaxの方を練習&プロトタイプとして使いたい アルゴリズムがシンプルなので、取っ掛かりとしては良さげ minimaxでもTDLeaf(λ)より性能が良い(と論文には書いてあった) てな感じです。 今日中に動作…