2009-05-06 ボルツマン分布での手選択を実装 開発日記 ソフトマックス方策*1の下準備としてボルツマン分布の部分を実装。と言っても、ほぼ前バージョンと同じルーチンです。 明日にはソフトマックスは実装完了の予定。もう、ほとんど出来たも同然です。 (あ、上の「出来たも同然」はソフトマックスの事で、将棋の学習が完成するのはまだかなり先です。) *1:評価値が高い手ほど高確率で選択する方策