GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2013-03-30から1日間の記事一覧

今すぐやるべき事、後でやる事、やらない事

基本方針は「強化学習による評価関数の精度向上を最優先」で。 んで、合議や並列探索はとりあえず無視。シングルスレッド動作で強くするのを目標とします。 選手権までのTODO 学習ルーチン(PGLeaf・ソフトマックス方策)のデバッグ エージェントと方策の連…

電王戦第2局

一成さん&Ponanzaさんおめでとうございます。 朝から一時中断つつ見てましたが、最後までハラハラしました。 これで勝ち星は1-1ですので、次の見所はどちらが勝ち越すかですね。 対局を見てて気合入ったんで、そろそろGA将!!!!!!の開発を再開します。

上手く行かない

本将棋で方策勾配法(PGLeaf)の学習をしてるんですが、なかなか強くなりません。 どうも、駒の価値が他の位置評価に比べて小さくなっているみたいで、正則化を有効にしたり色々やってみても一向に改善の気配無し。 このままだと、来週のオープン戦はおろか選…