2007-03-01から1日間の記事一覧
パラメータ自動調整用の評価関数のコーディング開始。とりあえず単独の駒の絶対テーブルによる評価を実装。 普通は駒割評価関数から実装するものなんでしょうが、色々考えた末実装しない事にしました。 理由は単純で「無くても構わない」。それだけです。 最…
行きのバスのみですが、完了。 旅の散策バスという奴で、名古屋→新宿の片道3500円。値段で決めました。 もし同じバスに乗る参加者がいたら(いないか?)、車中で話してみたいですね。あ、ちなみに私の席は最後部右側です。
をアイデアメモに書こうかと思ってたんですが、既に前例がありました。 どういうものかと言うと、強化学習自体のパラメータ*1を強化学習でコントロールしたらどうかな、ってアイデアです。 名付けて“メタ強化学習”。 似た様なアイデアはGA*2でも“メタGA”っつ…