GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2013-06-01から1ヶ月間の記事一覧

今日の成果

置換表を旧バージョンから移植(最善手の保存・参照のみ) LMRの実装 Null Move Pruningの実装 強化学習した評価関数パラメータを用いてプロ棋士の棋譜1局との一致率を求めたところ、今日の修正で一致率が21%から28%に向上しました。 まぁ、一致率上がった…

SEEの高速化案

やっぱりSEEの計算が重いので、差分計算してみようかと検討中。 SEE計算は大雑把に分けると 特定のマスに利いている駒の交換値をリストアップする 実際に駒を交換した場合の評価値の増減を計算する という2ステップになっています。 んで、私の実装だと前半…

SEEでのムーブオーダリングを実装中

正確にはStatic Exchange Evaluationとは違うかもしれませんが、「駒の移動による駒割の変化を見積もるルーチン」を実装して、ムーブオーダリングに使用しています。(SEE単体ではなく、History Heuristicと組み合わせて使用しています。) んで、まず全幅探…

うーん…

http://news.mynavi.jp/news/2013/06/20/125/index.html 比較的小規模なクラスタ環境で大規模なニューラルネットを構築したってニュースですが、以前ほどニューラルネットにワクワクする感じがしなくなったのはなんでだろう。 一つ思いつくのは、「人間の脳…

衝動買い

乱択アルゴリズム (アルゴリズム・サイエンス・シリーズ―数理技法編)作者: 玉木久夫出版社/メーカー: 共立出版発売日: 2008/08/08メディア: ハードカバー購入: 4人 クリック: 52回この商品を含むブログ (8件) を見る 他の本を買いに本屋に行ったんですが、タ…

強くなるロボティック・ゲームプレイヤーの作り方 ~実践で学ぶ強化学習~

強くなるロボティック・ゲームプレイヤーの作り方 ?実践で学ぶ強化学習?作者: 八谷大岳,杉山将出版社/メーカー: マイナビ発売日: 2008/08/27メディア: Kindle版この商品を含むブログ (1件) を見る 紙媒体の方は絶版らしいですが、Kindle版がいつの間にか出て…

とりあえず学習出来る所までは完成

αβで全幅+二段階静止探索、ムーブオーダリングはHistory Heuristicのみ、枝刈・延長・短縮無しっていう手抜きルーチンですが。 それから、PGLeafの学習ルーチンは並列化してみました。 という訳で、「とりあえず学習出来る」ってレベルにはなったので、一晩…

とりあえずプチプチとバグ潰し中

昨夜のコンパイルエラーは解決したんで、アサーション有効で走らせて一個ずつパグを潰してます。 んで、それも大分落ち着いてきたんで今度はαβ探索ルーチンを実装していきますか。

さて…

帰宅してこれから開発の時間ですが、113個のエラー… _| ̄|○ 多分原因箇所は1個2個なんでしょうけど、それを洗い出すのに時間かかりそうですね。

評価関数の実装に着手

将棋関連の局面クラスは9割がた完成*1して、現在は評価関数の実装中。 とりあえず、駒割+二駒の絶対位置関係だけのシンプルなコードでやってます。 んで、評価関数が出来たから一手読み探索ルーチンと組み合わせて学習させようとすると、コンパイルエラーが…