2017-12-09 交差エントロピーのみの損失関数でパラメータが振動する現象 開発日記 三目並べ・5五将棋で各種オプティマイザを使ってパラメータの推移を見てみました。 三目並べモード、SGD。 三目並べモード、RMSProp。 三目並べモード、AdaDelta。 5五将棋モード、AdaDelta。 つまり、ゲームの種類(And 探索ルーチン・評価関数)やオプティマイザの種類によらずに発生する現象な訳で、損失関数の微分がおかしいって線が濃厚ですね。 …困った。