2014-06-06から1日間の記事一覧
SR-PGLeafで評価関数と探索ルーチンのパラメータを同時に学習させたもの。 結果、569-?-59で勝率90.6%。95%信頼区間は88.0〜92.8。 期待していた程は勝率が上がってないですが、とりあえず次は本将棋の方で学習させたのを試してみます。
SR-PGLeafで評価関数と探索ルーチンのパラメータを同時に学習させたもの。 結果、569-?-59で勝率90.6%。95%信頼区間は88.0〜92.8。 期待していた程は勝率が上がってないですが、とりあえず次は本将棋の方で学習させたのを試してみます。