GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

チマチマとデバッグ中

 報酬の計算式が変だったり、勾配の計算が変だったりしたのを修正。

 ただこれ、リバーシ固有のコードのバグだから、将棋の方には関係無いよなぁ。て事は、このまま将棋にリトライしても望み薄って事で… うーん、どうするか…

 とりあえず、リバーシの方は一応学習出来る様にはなったので、この後色々実験してパラメータの値が発散する原因を突き止めようかと考え中。

 つーか、私の実装だとテーブル形式の評価関数+方策勾配法は無駄が多すぎ。もうちょっとスマートに書かないと。