2017-06-02から1日間の記事一覧

オーバーフィッティングしてるよ (´・ω・`)

開発日記

えー、うちのCritic曰く「三目並べの初期局面の評価値は0.6点」だそうです。勝率80％に相当する数字。うん、バグってますね。どこが悪いのかな〜。ネットワークがデカすぎる*1？それとも学習率*2？ RMSPropが悪さしてるって事は無いよね〜、多分。 15:14:…

開発日記

Caffeの導入も無事終わり、現在は三目並べにDeep Learningを利用して実験中です。んで、困った現象が一つ。まず、学習自体はちゃんと出来ている様です。学習した評価関数*1を使用して自己対局すると、ちゃんと引き分けます。また、片方のプレイヤーを学習…