2010-08-25から1日間の記事一覧

αβの再実装完了

開発日記

ちょっと前からαβ探索ルーチンを書き直していたのですが、それが終わったんで実戦投入。今までは学習と対局で別のルーチンを使っていたのですが、これで共用に出来ました。それから、評価項目追加はあまり成果が出なかったんですが、とりあえず悪さをしてい…

アイデアメモ

今までは各弱エンジンが一票全てを最善手に投じていましたが、別に一票全部を一つの手に集める必要は無いんじゃないかと思って。んで、強化学習で使うソフトマックス戦略を用いて、ルートノードでの各手に対して、その選択確率に応じた票を投じるってのを考…