GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-07-09から1日間の記事一覧

パラメータ修正前後での誤差の変化

現在は学習アルゴリズムにTDLeaf(λ)を全幅2手+静止探索のルーチンと組み合わせて使っていますが、これだとPVが長くなるのでパラメータ修正前後でちゃんと誤差が減っているか不安です*1。 という訳で、実際にパラメータ修正の直前直後の誤差*2を比較してみま…

VS ssp 七晩目

183-0-188で勝率49.3の95%信頼区間が44.1〜54.5。 ようやく強くなってきましたね。と言っても、前のケースでは勝率70%まで行きましたから、こっちはまだまだですが。 sspとの対局の様子を眺めていると、拙いながらも序盤の学習が進んでそうな様子なので、こ…