2010-09-04から1日間の記事一覧
「TD(λ)とTDLeaf(λ)の違いは、価値関数(=評価関数)の実装方法の違いだけなんじゃないか」って話をダラダラと書きます。要はチラシの裏。個人的に考えをまとめるためだけのものです。 まず、適格度トレースがあると話がややこしくなるので、ここではTD(0)…
将棋世界 2010年 10月号 [雑誌]出版社/メーカー: 毎日コミュニケーションズ発売日: 2010/09/03メディア: 雑誌購入: 1人 クリック: 6回この商品を含むブログ (7件) を見る 読みました。一成さんの連載。 楽観的合議に関してはまだ強くなる理由が解明されてな…
引き続き学習させたパラメータ。 189-11-385で勝率32.9%。95%信頼区間は29.1〜36.9。 誤差程度にしか強くなってないです。