自動学習の途中経過 - GA将？開発日記～王理のその先へ～

　昨日の結果は“学習率が高すぎ”っていう、ものすご〜く基本的なミスが原因でした。多分、最後の方に学習した棋譜の内容に引っ張られて変な結果になってたんでしょう。

　で、修正して一晩走らせてみました。結果は以下の通り。

CompositeEvaluator::printReport() >  -31.47, -40.71,-108.04,-125.86, 100.28,-121.34, -74.51, -70.07,  16.65
CompositeEvaluator::printReport() >    0.00,-134.15,   0.00,   0.00,   0.00,   0.00,   0.00, -70.76,   0.00
CompositeEvaluator::printReport() >   43.02, -28.82,  -3.71,  21.20,  -5.35,  24.60,  45.54,   1.17, -15.55
CompositeEvaluator::printReport() >    0.00,   0.00,   0.00,   0.00,   0.00,   0.00,   0.00,   0.00,   0.00
CompositeEvaluator::printReport() >    0.00,   0.00,   0.00,   0.00,   0.00,   0.00,   0.00,   0.00,   0.00
CompositeEvaluator::printReport() >    0.00,   0.00,   0.00,   0.00,   0.00,   0.00,   0.00,   0.00,   0.00
CompositeEvaluator::printReport() >   12.72, -28.50,  -2.12,  61.76,  91.02,  -2.06,  -6.77,  67.06, -34.45
CompositeEvaluator::printReport() >    0.00,  80.08,   0.00,   0.00,   0.00,   0.00,   0.00, 117.48,   0.00
CompositeEvaluator::printReport() >   96.69,  48.87,  37.72, 137.54, -66.94, 108.29,  40.40,  56.70,  48.82
CompositeEvaluator::printReport() >  歩 :   16.43,  46.92,  29.48,  21.55,  42.30,  20.81,  34.86,  -8.68,  -5.12,   1.20, -23.16,  15.25,  19.51, -27.94,
CompositeEvaluator::printReport() >  桂 :   46.87,  23.47,  12.70,  33.06,
CompositeEvaluator::printReport() >  香 :   52.87,  28.01,  46.48,  48.61,
CompositeEvaluator::printReport() >  銀 :  103.66,  48.69,  54.47,  33.26,
CompositeEvaluator::printReport() >  金 :  118.90,  75.02,  71.12, -64.13,
CompositeEvaluator::printReport() >  角 :   60.00,  60.70,
CompositeEvaluator::printReport() >  飛 :  126.19, 105.15,

　下のあるのは持ち駒の点数*1で、左から順に1枚目・2枚目…です。

　なんか、一枚目の角より金銀の方が価値が高い。これが噂のBonanza化？

　ただ、私の場合は原因がはっきりしていて、棋譜の最後にある勝敗の決した局面を重視して学習しているからでしょう。

　で、そういう局面では金銀があった方が詰みやすいから、こういう結果になったのかと。

　そう考えると4枚目の金の価値がマイナスなのも納得で、金が3枚あって詰まないなら斜め後ろに利く駒が必要。だから、4枚目の金を取る様な無意味な事をすると余計に状況が悪くなる、って事でしょう。

　まぁ、私の棋力はお猿さん以下なので、上記の分析はネタ程度に考えて下さい。

*1:先手から見た値。後手は符号反転して使用