GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2009-01-01から1年間の記事一覧

結局置換表関連はほとんど破棄

私のコードの場合、持ち駒優劣関係のある局面に「ほぼ負け」の評価値を与えている関係で、同一局面であってもそこに至るまでの手順次第で評価値が変わります。 という訳で、ハッシュに評価値の上界・下界を保存してあっても参考にならない訳で、その辺ざくっ…

αβ全幅を実装中

今はαβですけど、一通り動く様になったらNegaScoutに改造する予定。 例によって例のごとく置換表まわりで色々苦労しました。えぇ、そりゃもう色々と。出来れば二度と触りたくない部分ですね*1。 ただ、予定よりは早く進行しているので、ひょっとしたら年内に…

選手権申し込み完了

使用マシンの申請は同時にしたので、後は参加費振込とアピール文章提出さえすればOK、と。

静止探索を再実装中

今日から会社が正月休みなので、まとまった時間が無いと出来なさそうな部分をやる事にしました。 という訳で静止探索をMinMax表記からNegaMax表記に変えて再実装中。やっぱりNegaMaxの方が個人的には好きです。 んで、これは前振りで、αβ全幅の方もNegaMax表…

第20回世界コンピュータ将棋選手権 参加者募集中

http://www.computer-shogi.org/wcsc20/ 来年5/2〜5/4。いよいよですね。 ライブラリに関して色々ルールが変わっていますが、いい感じにまとまっていると思います。 さて、後は自分のプログラムを何とかするだけ…なんだけど、全然めどが立たない orz

CUDAでニューロ評価関数を動かすのは難しいかも

こういうソースを書いて、ホスト(CPU)・デバイス(GPU)間のデータ転送・カーネル関数実行回数を計測してみました。 float D_h, *D_d; cudaMalloc( (void **) &D_d, sizeof( float ) ); // タイマー実行 unsigned int timer; cutCreateTimer( &timer ); cu…

CUDA実習中

とりあえず開発環境構築して、CUDA本のサンプルを動かせる様にはなりました。 さて、これをベースに何をしよう。配列の総和計算はサンプルがあるから、最大値計算とかやってみようかな。

パラメータへのノイズ付加による探査促進

一局終了ごとに、評価関数の全パラメータにそれぞれ独立した小さなノイズを加える ノイズはどんどん累積させていく ノイズには平均0分散0.000001位の正規乱数を用いる 要するに、小さなステップ幅でパラメータをランダムウォークさせようって事です。 こうす…

ちょっとカカクコムを覗いたら

GeForce GTX 295が5万円! そんなに安いなら欲しいけど、Fermiが出るまで我慢我慢。

CUDA本購入

この前書いたCUDAの本が取り寄せ完了したので受け取ってきました。早速今から読みます。

2014年のCPUはLarrabee系コアを統合?

http://pc.watch.impress.co.jp/docs/column/kaigai/20091222_338322.html 一番上の図を見る限りでは、Nehalem→Sandy Bridge→Haswellに続く次のマイクロアーキテクチャチェンジのタイミングで統合するみたいですね。 IntelとしてはそれまでにLarrabeeの実績…

God knows..(らっぷびとver)

ながとダイアリーさんで紹介されていた曲で、気に入ったのでここでも貼りつけます。 ニコニコ経由でメジャーデビューした人らしい。スゲーっす。

Pine Trailこと新型Atom発表

http://pc.watch.impress.co.jp/docs/news/20091221_338355.html 従来のAtomをベースにグラフィックスとメモリコントローラを統合したもののようですね。 一台組みたいけど、置く場所とか資金とかいろいろ足りない。ここは我慢するしか無いですね。

やっぱりもうちょっと温度高めでやってみます

目標探査回数2回だと探査が少なすぎて局所最適にはまってる感じがするんで、もうちょい探査多めでリトライします。 んで、温度調整を探査回数ベースから探査率ベースに書き換えて、目標探査率10%で学習用マシンに投入。 他の評価関数とかの設定は以前のとお…

学習用マシンに新バージョンを投入

評価項目全部入り UCT方策+ソフトマックス方策 目標探査回数2回 探索は全幅1手+静止探索4手 さて、上手く行くのかどうか。

新バージョン vs ssp

新バージョンで学習したパラメータ+新バージョンプログラムで連続対戦。 結果、164-2-186で勝率46.9%、95%信頼区間は41.5〜52.2。 旧バージョンで学習した場合より20ポイントほど勝率低いですね。うーん。 まぁ、評価項目増やせば強くなるかもしれません…

旧バージョンの実験は失敗

評価項目が駒割+敵玉との距離だけだと、攻める項目に偏ってるのでダメだったみたいです。 どういう事かと言うと、攻める為の評価項目で守りの評価もしようとして、結局全体としては使い物にならない評価関数が出来ていました。 という訳で、駒割+敵玉との…

詰将棋暴走の続報&vs ssp

結局、対sspの途中で暴走が再現していました。うがー、こんな時に起きなくていいんじゃー。 んで、とりあえずログを見て証拠は揃ったので、対策しときました。sspとの連続対戦は今夜リトライします。 さて、そんじゃぁ旧バージョンの学習を様子見てみますか。

CUDAの解説本が出たらしい

はじめてのCUDAプログラミング―驚異の開発環境[GPU+CUDA]を使いこなす! (I・O BOOKS)作者: 青木尊之,額田彰,第二I O編集部出版社/メーカー: 工学社発売日: 2009/11メディア: 単行本購入: 11人 クリック: 310回この商品を含むブログ (29件) を見る 欲しいけど…

HYBRID W-ZERO3は2010/01/28発売

http://www.willcom-inc.com/ja/corporate/press/2009/12/17/index.html 料金は基本使用料+パケット上限+端末代で月額¥8,180みたいですね。 私はWILLCOM 03の2年縛りがあるのですぐには機種変しませんが、この金額なら縛りが切れたらすぐに乗り換えるかも…

vs Lesserkai 20戦

新バージョンで約25万局の学習が完了したので、そのパラメータの強さを検証中。 で、新バージョンパラメータ+新バージョンのプログラムで、Lesserkaiに20連勝。ある程度強くなってるのは確かなので、今夜はsspとの連続対戦を走らせときます。 それから、学…

詰将棋ルーチンが暴走する件

どうも、通常探索で一手詰み(に限らず、短時間で読める詰み)を発見した時に起きるらしい。 通常の動作順序は下記の通り。 詰将棋ルーチン動作開始 通常探索動作開始 通常探索動作完了 通常探索のスレッドが、詰将棋を中断させる 詰将棋ルーチン動作停止 で…

pishogiに負けてる

http://wdoor.c.u-tokyo.ac.jp/shogi/view/index.cgi?go_last=on&csa=http%3A%2F%2Fwdoor.c.u-tokyo.ac.jp%2Fshogi%2FLATEST%2F%2F2009%2F12%2F16%2Fwdoor%2Bfloodgate-900-0%2BGasyou%2Bpishogi%2B20091216053007.csa 原因は二つあって、こいつらが同時に発…

連続対戦ツールを実装中

とりあえず勝敗を集計して勝率を出す所までは完了。 千日手・王手千日手とか打ち歩詰めの判定は未実装。てか、これをやろうとすると将棋盤+手生成ルーチンが必要。メンドクセー。 いっその事れさぴょん for Javaを使わせてもらおうかとも考えましたが、使い…

Google IMEインストールしてみました

せっかく64ビット版が出たわけですし、ちょっと試してみようかと思いまして。 で、う〜ん、なんというか、フツーに出来がいいだけにコメントに困ります。もっとこう、どっか変だったり独自色があったりすると面白いんですが、そういう事も無いですし。 変換…

vs ssp

260-4-122で勝率68.1%、95%信頼区間は63.1〜72.7。 25万局前後のパラメータの結果とは誤差程度しか差が無いですね。 となると、予想より収束が速いというか、伸びしろが無いというか、そういう結論になります。うーん。

旧バージョンで100万局の学習終了

きっちり10日で終わりました。 んで、軽く対局させてみたんですが、どうも弱くなってる様な… まぁ、一晩やってみないと正確な勝率はわからないんで、今夜は連続対戦させて寝ます。 それから、学習用マシンには新バージョンを投入。こっちも基本的には旧バー…

Larrabee GPUは白紙に

http://pc.watch.impress.co.jp/docs/column/kaigai/20091210_334671.html まとめると 第一世代LarrabeeのGPUとしての市場投入は白紙撤回 アーキテクチャから見直したバージョンを開発し、それを市場投入するんじゃないかとの推測 ひょっとしたら、いきなりC…

方策オフモードのバグ取り

バグ取りというか何と言うか… 評価関数の値が変な値に更新されている所を、順番に過去にさかのぼってどんどん見ていって、結局バグじゃなくって正常な動作(学習不足でたまたま変な値になっていたらしい)だと結論付けました。 …でも、なんかバグの可能性も…

gps500にtime upで負けてると思ったら

負けが確定した時点でバグって発狂してました。 まぁ、放置してもどうせ負けなんで問題無いんですが、みっともないので対策しました。あと、連続対戦が止まると困るし。 んで、Rは1300突破目前。いい感じです。