2009-02-27から1日間の記事一覧
まずは短期。 探索ルーチンの修正 SEEでオーダリングを試してみる MTD-∞ ちゃんとプロファイルとる 中期。選手権まで。 将棋の学習関連 TDLeaf(λ)エージェントを再実装。 方策をエージェントから独立させる。 学習中の各種統計情報の収集・表示ルーチン実装…
勝率66.2%で95%信頼区間が60.6〜71.5。って、昨日より勝率下がってますね。 うーん、どうしよう。追加した分の評価項目は外すかこのままか… とりあえずは全項目ありで学習させて、無い方が強くなる項目は後で外しましょう。