さらに拡張
まず、パラメータの類とそれが影響する範囲をまとめると、こうなります。
メタメタパラメータ
↓ 動作に影響する
メタエージェント
↓ 調整する
メタパラメータ
↓ 動作に影響する
エージェント
↓ 調整する
パラメータ
↓ 動作に影響する
評価関数
で、今まではメタメタパラメータを手作業で設定していたのですが、それだと上手く動かない場合があるので、メタメタパラメータも自動的に調整する様に変更。
といっても、メタメタエージェントを作ってそいつがメタメタパラメータを調整する様にすると、今度はメタメタメタパラメータを設定する必要があって、どこまで行っても調整すべきパラメータ類がなくなりません。
という訳で、メタエージェントが自分自身のメタメタパラメータも調整する事にしました。実際には「じぶんのメタメタパラメータを設定している」とは意識していなくて、(誰のかは知らないけど)誰かのパラメータを設定している、(誰がかは知らないけど)誰かが自分のメタメタパラメータを調整してくれる、という感じですが。
さて、これで4x4のリバーシを実験して、上手く行きそうなら6x6に挑戦してみます。