困った
えーと、まずは学習の調子から。
テストとして学習用1局・検証用1局の棋譜を使用すると、検証用棋譜でのRMSEが0.13位までしか下がりませんでした(Deep Learningの第一層の値)。
んで、試しに棋譜を100局にすると、RMSEが0.05チョイに。まぁそれは良いんですよ。精度上がっただけなんで。
ただ、20時間かかってイテレーションが65回しか回ってなくて、第一層の学習すら終わってないです。
つー事で、ヘタすると全12層の学習に1ヶ月かかるかも、って状況です。たった100局の学習なのに。
そんな訳で何とか高速化したいんですが、どうしようかと。
現状はシングルスレッドでSSE未使用なんで、マルチスレッド化+SSE使用にして20倍程度は高速化出来るかもしれませんが、正直焼け石に水レベル。
学習ルーチンは棋譜に従って局面を進めていって、後はガリガリとバックプロパゲーションで学習するだけ*1なので、GPGPUの方が相性良いかもしれません。
…う〜ん、どうしよう。