学習時専用の探索ルーチンを実装

開発日記

αβ探索がバグってる疑惑があるんで、全幅1手＋静止探索に限定した探索ルーチンを実装。現在アサーション有効にしてテスト中。 …暇なんで、も一回日向ぼっこしてきます。

コードネーム「India」開発開始

開発日記

Ver.9だからNATOフォネティックコードの9番目っていう安直な名前ですが、「India」というソリューション名でGA将!!!!!!!!!の開発を開始。とりあえず、今日中には合議用SR-PGLeafで三目並べの学習が動く様にしたいですね。つっても、やる事はVer.8から各種…

遅くなって申し訳ありませんが、選手権時の話。芝浦将棋Jr.の五十嵐治一先生、ひまわりの山本一将さんと共同で、CSA研究賞を頂きました。強化学習の一手法である方策勾配法に関する一連の研究に対して、「コンピュータ将棋をさらに強くできる可能性を示し…

開発日記

「先手頑張れ、先手頑張れ！！あーーーーーーーーーっ、負けた＿|￣|○」って考えてたら、GA将!!!!!!!!!は後手だった。 …ありますよね、こういう事。

開発日記

まず、従来の*1合議では、単一の評価関数＆パラメータから、評価値に適当な乱数を足して複数の合議クライアントを生成します。で、複数クライアントが個別に探索し、その結果から得票数が最高の手だったり評価値が最高の手だったりを選択します。私が今から…