GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

来年に向けてのタスク

 完成形の目標はこんな感じ。

  • 線形の評価関数
    • 玉の固さをちゃんと評価出来る様にする
  • 普通のαβ探索
    • 第25回選手権バージョンをリファクタリングするだけで、それ以外は極力いじらない予定
  • 16種類の評価関数による多数決合議
    • 対局時は、シングルスレッド探索ルーチン×16クライアントで合議をする
    • 16種類のリーグ戦からSR-PGLeafで学習
    • 1イテレーションで複数回のパラメータ更新をする手法*1の実装
    • 可能であれば、クライアントの重み(投票数)を学習で調整する

 んで、ざっくりしたスケジュール。

5月 合議用SR-PGLeafの実装
6月 学習を回しつつ、合議で対局するルーチンの実装&探索ルーチンのリファクタリング
7月 複数回のパラメータ更新を実装
8月〜 後で考える

 えぇ、適当ですとも、適当。

 去年はタイトなスケジュールを組んじゃって苦労したんで、今年は臨機応変に対応します。

 秋には「何か」あると思うので、まずはそこに向けて開発します。

*1:GPSチームがボナメソで提案したもの