GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

評価関数を小規模修正+α

 まず、今までは盤上の駒の価値と持ち駒の一枚目の価値を別のパラメータに保存していました。

 ただ、これだと盤上の駒の価値の変化に持ち駒の価値の変化が追いついていない感じがあったので、ここを少し修正。

 やった事は簡単で、持ち駒の一枚目の価値を「盤上の駒の価値+一枚目の差分」にしただけです。ちなみに二枚目以降は一枚目と二枚目の差分を加算、二枚目と三枚目の・・・と言う感じで続きます。

 それからもう一つ。TDLeaf(λ)はαβ全幅+静止探索二段でやっていたのですが、αβと静止探索一段目ではProbHeuristicでオーダリングする事にしました。

 正確な数値は測っていないのですが、体感では数倍高速化した感じです。特に、中盤以降の駒の取り合いが増えた局面が速くなりました*1

 あ、ProbHeuristicというのは以前本宅で書いたHistoryHeuristicの変種です。

 ついでに、ProbHeuristicの実装も少し変えて、ルートノードが変わるごとにテーブルをクリアしなくて済む様にしました・・・が、こっちの効果は不明。まぁ、やらないよりはマシ、ってレベルでしょう。

*1:と言うか、遅くならなくなった