2015-11-09から1日間の記事一覧
合議用に複数の評価関数を並行して学習するもので、Dropout*1を使用します。概要は下記の通り。 合議クライアント8個は、全て同じ評価項目の評価関数を用いる。 8クライアントのリーグ戦の結果から学習する。 学習アルゴリズムはPGLeaf。 各クライアントは、…
合議用に複数の評価関数を並行して学習するもので、Dropout*1を使用します。概要は下記の通り。 合議クライアント8個は、全て同じ評価項目の評価関数を用いる。 8クライアントのリーグ戦の結果から学習する。 学習アルゴリズムはPGLeaf。 各クライアントは、…