2008-02-09から1日間の記事一覧
アホか、自分。
今からパラメータにボーナス与える部分を実装します。
Parameterというクラスが既にあるんで、そこで学習時に使用した回数*1をカウント。 後はファイルにパラメータをセーブ・ロードする時にパラメータごとの学習回数も一緒に処理して、評価関数全体の学習回数も同じファイルに保存。 って書くとすんなりいったか…
対局数で計算して40%ほどアップ。 まぁ、これなら良しとしますか、とりあえずは。
という訳で今日は部屋に引き篭もってます。 あ、すいません、ウソでした。今から引き篭もります。起きたばっかなんで。 と言うか、外に出てなんかする暇なんてねーです。開発しないとピンチなんで。
色々細かいトラブルがあったのでメモ&解説。 まず、「パラメータごとのボーナス」から「評価関数全体のボーナス」を計算します。 パラメータごとのボーナスは「sqrt(2.0*log(パラメータの使用回数)/評価関数全体の学習回数) * abs(特徴量)」としました。 sq…