GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

そろそろやる事を絞る時期かも

 まず、現在3つの方式での学習を実装しました。

  1. Bonanza戦でのTDLeaf(λ)
  2. 自己対戦でのTDLeaf(λ)
  3. 自己対戦でのSelf-Play Bonanza Method

 んで、今の所2.が一番ましな強さになってるので、選手権まではそれに集中する事にします。1.にもまだ伸びる可能性は感じるんですが、残り40日でどうにか出来るとは思えないので、当面は封印します。

 あ、ちなみに3.はダメダメでした。まぁ、ダメってのが分かっただけでも儲け物です。

 という訳で学習用マシンに2.の方式のプログラムを投入。全幅1手でザッと学習したパラメータを引き継いで、今度は全幅2手で学習させてみます。

 目標は選手権までにfloodgateの2週間レーティングが1700なんですが、見通しは厳しいです。