GA将？開発日記～王理のその先へ～

ネタ勢最強を目指して絶賛開発中。

2008-01-01から1ヶ月間の記事一覧

評価関数の修正中

開発日記

昨日書いたのと同じ様に、王将との相対位置も先後共通のパラメータにしました。こっちは、先手玉から見て(0,-1)にいる後手の金と、後手玉から見て(0,1)にいる先手の金で同じパラメータを使う。ただし、特徴量は後手の金は-1で先手の金は+1、って感じです。 …

Nehalemファミリの性能に関する妄想

コンピュータ関連

45nmのCore 2が無事発表されたので。まず、NehalemファミリはCore 2より1コア当たりの面積が1.5倍になっているらしいです。ただし、SMT*1による増加分が5〜10%あると考え、シングルスレッド性能に影響する部分は40〜45%増としておきます。んで、ポラックの…

絶対位置による駒の評価を修正

開発日記

今までは駒の位置・種類・手番ごとにパラメータを用意していたのですが、これを「先手のx筋y段の種類tの駒」と「後手の10-x筋10-y段の種類tの駒」で共通にしました。今まで別のパラメータを用意していたのには先手と後手で絶対位置による評価値は別の可能…

公式

雑記

コンピュータ将棋のWikiを見ていて、何の公式かパッと見で分かりませんでした。ダメだ俺、何とかしないと。

αβの高速化は

TODO

MTD(f)って選択肢もあるのを忘れていました。去年の選手権で採用して、バグで落ちまくった苦い経験があるからか、すっかり頭から抜けていました。あ、念の為に書いておくと悪かったのは私の頭で、MTD(f)には何の原因もありません。将棋関連将棋用の評価…

PenrynファミリのCore 2 Duo/Quad発表

コンピュータ関連

発表記事 http://pc.watch.impress.co.jp/docs/2008/0108/intel.htm レビュー http://www.4gamer.net/games/030/G003078/20080108001/ 現行のMeromファミリからは小幅な性能アップ＆大幅な低消費電力化って感じでしょうか。私は買い換えるつもりはありませ…

キーボード到着

コンピュータ関連

なんやかんや色々写ってますが気にしないでください。分かりにくいですが、ブツはこれです↓ Lenovo ThinkPlus USBキ-ボ-ドウルトラナビ付 [31P8974]出版社/メーカー: Lenovo発売日: 2003/05/22メディア: Personal Computers購入: 1人クリック: 168回この…

入玉を忘れてた

TODO

何で、追加。他は以前通り。将棋関連将棋用の評価関数の実装駒割絶対位置による評価王将との相対位置による評価二駒の位置関係王将の動ける範囲王将周辺の利きの数先後共通のパラメータを使う様に上記項目を修正将棋で使う為に強化学習関連のクラ…

色々細々修正完了

開発日記

上に書いた通り、TDLEaf(λ)関連です。学習則の部分を重み修正直前の評価値を基準に。対局中に詰みを発見した場合は、常にグリーディー行動を選択する様に修正。詰んでいる場合は途中のノードの評価値も学習。一つ目は、以前はエピソード*1中の評価値を基…

今週の予定

開発日記 TODO

月曜：TDLeaf(λ)の学習部分修正火曜〜水曜：評価関数の修正＆みっちりテスト木曜：千日手・打ち歩詰め関連の実装検討金曜：酒飲んで寝る週末：予備期間さて、今日はウェブの巡回はサクッと済ませたし、バックアップは今やってるところだし、後は開発す…

まずは評価関数をきちんと作ろう

TODO

将棋関連将棋用の評価関数の実装駒割絶対位置による評価王将との相対位置による評価二駒の位置関係王将の動ける範囲王将周辺の利きの数先後共通のパラメータを使う様に上記項目を修正将棋で使う為に強化学習関連のクラスをC++に移植 TDLeaf(λ) 将棋…

ABC探索は断念

開発日記

共謀深さ算出の為には、何らかの方法でノードの評価値を予測する必要があるのですが、今の私には静止探索位しか思いつきません。で、「静止探索にかける時間＞不要なノードを探索しない事で削減出来る時間」になっちゃって、単純なαβよりも遅くなってしまい…

高速化予定（短期）

開発日記 TODO

とりあえず後一手でβカットが確定している場合の対処は完了。5倍位は速くなったか？それから、関連して細々したバグも潰して、そこそこまともになったっポイです。後1手でβカットが起きる時の対処（Inside KFEndの手法）ハッシュ表を組み込みハッシュの…

今の時間帯になって始動

開発日記

二日酔いは辛かったっす。さて、ABC探索を使うと読み筋がどうも変で、角交換の後に馬を作らせて平気な顔をしています。んで、試しに評価関数を駒割のみにしてみると今度はその症状は出なくなるものの、今度は大抵の兄弟ノードで評価値が同じになってABC探…

休日にしては早起きしましたが

雑記

二日酔い・・・＿|￣|○ とても開発出来る体調じゃないっす。

高速化予定（短期）

開発日記 TODO

後1手でβカットが起きる時の対処（Inside KFEndの手法）ハッシュ表を組み込みハッシュの最善手をオーダリングで上位に持ってくる静止探索で得た上界・下界を保存、次回探索時に再利用学習で必要なのでPVも保存

どうも動作が変

開発日記

PVの打ち切り深さ*1と平均の打ち切り深さを比較したりとか色々ログを出してみたんですが、どうもPVより他の部分を深く探索している様です。となると、根本的にどっか変な可能性があるので、高速化は後回しにしてちゃんと動く様にしておくのが先ですね。怪…

ABC探索は動いた・・・のか？

開発日記

一応コンパイルエラーも実行時エラーも出ない状況になって、PVもちゃんと取得出来る様になりました。が、同条件で比較すると、手数打ち切りのαβより遅い。これでは無意味です。という訳で高速化の方針を検討中。まずはInside KFEndの「静止探索値を求める…

酔デバッグ

開発日記

正攻法じゃぁどうにもならなさげなので、久しぶりにやってみます。

今年の抱負

コンピュータ将棋

と言うか、次回選手権の抱負。個人的な感覚として、年の区切りが選手権になってるんでｗ HIT将棋さんにリベンジ*1 一次予選で勝ち越し（1/2修正）死ぬ気で強化学習将棋を完成させるバグで落ちないちゃんと参加する前日夜に飲みすぎて二日酔いにならない …