クラスタ化でどの程度レーティング伸びるか調べてみた
本将棋の対sspで、双方1手1秒の場合とGA将!!!!!だけ10倍の時間考える場合とで、勝率がどの程度違うか調べてみました。
んで、結果。双方1秒だと8-2-48で勝率14.3%、95%信頼区間が6.4〜26.2。10倍考えると35-3-29でそれぞれ54.7%、41.7〜67.2です。
幅はありますが、95%信頼区間の上限・下限で計算するとR向上は125〜535、勝率で計算するとR向上は340って所でしょうか?
クラスタ化で10倍高速化するとなると、多分100台前後、ひょっとしたらもっと多く必要でしょうから、コストパフォーマンスは悪そうですね。てか、私個人じゃそれだけの台数は金銭的に無理ですし。
評価関数のパラメータ学習が上手く行けばR+1000位は達成出来る可能性もある訳で、当面クラスタ化や高速化は考えずに学習に集中しますか。