GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2014-11-05から1日間の記事一覧

search()関数の実装、半分完了

あ、枝刈り関連は全く書いてないんで、半分は言い過ぎかも。 ま、とりあえず全幅探索をする所は書き終わりました。 後は静止探索と各種枝刈りか。今週中には終わるかな?

強化学習では方策が重要

もう何度目になるか分からないですが、「Softmax方策がコンピュータ将棋における強化学習の最適解」か迷っています。 Softmax方策では「評価値が高い手ほど高確率で選択する」というのが基本動作ですが、別に学習中の自己対戦で勝率を上げた所で、最終的な強…