今日の成果

開発日記

置換表を旧バージョンから移植（最善手の保存・参照のみ） LMRの実装 Null Move Pruningの実装強化学習した評価関数パラメータを用いてプロ棋士の棋譜1局との一致率を求めたところ、今日の修正で一致率が21％から28％に向上しました。まぁ、一致率上がった…

2013-06-24

SEEの高速化案

開発日記

やっぱりSEEの計算が重いので、差分計算してみようかと検討中。 SEE計算は大雑把に分けると特定のマスに利いている駒の交換値をリストアップする実際に駒を交換した場合の評価値の増減を計算するという2ステップになっています。んで、私の実装だと前半…

2013-06-23

SEEでのムーブオーダリングを実装中

開発日記

正確にはStatic Exchange Evaluationとは違うかもしれませんが、「駒の移動による駒割の変化を見積もるルーチン」を実装して、ムーブオーダリングに使用しています。（SEE単体ではなく、History Heuristicと組み合わせて使用しています。）んで、まず全幅探…

2013-06-20

うーん…

コンピュータ将棋

http://news.mynavi.jp/news/2013/06/20/125/index.html 比較的小規模なクラスタ環境で大規模なニューラルネットを構築したってニュースですが、以前ほどニューラルネットにワクワクする感じがしなくなったのはなんでだろう。一つ思いつくのは、「人間の脳…

2013-06-20

衝動買い

開発日記

乱択アルゴリズム (アルゴリズム・サイエンス・シリーズ―数理技法編)作者: 玉木久夫出版社/メーカー: 共立出版発売日: 2008/08/08メディア: ハードカバー購入: 4人クリック: 52回この商品を含むブログ (8件) を見る他の本を買いに本屋に行ったんですが、タ…

2013-06-19

強くなるロボティック・ゲームプレイヤーの作り方　~実践で学ぶ強化学習~

コンピュータ将棋

強くなるロボティック・ゲームプレイヤーの作り方 ?実践で学ぶ強化学習?作者: 八谷大岳,杉山将出版社/メーカー: マイナビ発売日: 2008/08/27メディア: Kindle版この商品を含むブログ (1件) を見る紙媒体の方は絶版らしいですが、Kindle版がいつの間にか出て…

2013-06-15

とりあえず学習出来る所までは完成

開発日記

αβで全幅＋二段階静止探索、ムーブオーダリングはHistory Heuristicのみ、枝刈・延長・短縮無しっていう手抜きルーチンですが。それから、PGLeafの学習ルーチンは並列化してみました。という訳で、「とりあえず学習出来る」ってレベルにはなったので、一晩…

2013-06-08

とりあえずプチプチとバグ潰し中

開発日記

昨夜のコンパイルエラーは解決したんで、アサーション有効で走らせて一個ずつパグを潰してます。んで、それも大分落ち着いてきたんで今度はαβ探索ルーチンを実装していきますか。

2013-06-07

さて…

開発日記

帰宅してこれから開発の時間ですが、113個のエラー… ＿|￣|○ 多分原因箇所は1個2個なんでしょうけど、それを洗い出すのに時間かかりそうですね。

2013-06-06

評価関数の実装に着手

開発日記

将棋関連の局面クラスは9割がた完成*1して、現在は評価関数の実装中。とりあえず、駒割＋二駒の絶対位置関係だけのシンプルなコードでやってます。んで、評価関数が出来たから一手読み探索ルーチンと組み合わせて学習させようとすると、コンパイルエラーが…

GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

2013-06-01から1ヶ月間の記事一覧

今日の成果

SEEの高速化案

SEEでのムーブオーダリングを実装中

うーん…

衝動買い

強くなるロボティック・ゲームプレイヤーの作り方　~実践で学ぶ強化学習~

とりあえず学習出来る所までは完成

とりあえずプチプチとバグ潰し中

さて…

評価関数の実装に着手