GA将?開発日記~王の理とは~

ネタ勢最強を目指して絶賛開発中。

2015-04-15から1日間の記事一覧

悪あがき

現在floodgateに投入中のパラメータ(全幅2手+静止探索で学習したもの)を引き継いで、全幅3手+静止探索で自己対局・強化学習を開始。 あ、全幅と言いつつLMRとFutility Pruningはしていますが。 で、強くなったらそれを採用。ダメでもfloodgateバージョン…

上の続き

酔っ払ってるんで細かい間違いはあるかと思いますが、とりあえずメモ。 今仮に、平手初期局面の先手の勝率が0.5とします。 で、対局すると先手が勝って勝率1.0になりました。 そうすると、初期局面では1bitあった「勝敗に関する情報量」が終局図では0bitにな…

つー訳で

酒呑んでます(爆) いやほら、「アイデアを出す=既存の枠組みを一度壊して再構築する」って事ですから、酔っ払って理性が半分飛んだ状態の方がアイデア出やすいんですよ、私の場合。 …アル中の言い訳みたいですね。

方策の改善案を思い付いた…かも

まだ具体的なアルゴリズムにまで落とし込めて無いんですが、なんとなくモヤッとした形は見えてきました。 大雑把に書くと、従来は「評価値の高い手を高確率で選択」だったのを、「評価値+得られる情報量(等)の高い手を高確率で選択」ってすれば上手く行く…

Core i7 5960Xマシンで投入

したものの、思考時間の設定変更を忘れててTime Up連発しています。すいません。 という訳で、7:00の回から設定変更したもので投入。 今日中にはレーティング付くかな?