GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-01-01から1ヶ月間の記事一覧

評価関数の修正中

昨日書いたのと同じ様に、王将との相対位置も先後共通のパラメータにしました。 こっちは、先手玉から見て(0,-1)にいる後手の金と、後手玉から見て(0,1)にいる先手の金で同じパラメータを使う。ただし、特徴量は後手の金は-1で先手の金は+1、って感じです。 …

Nehalemファミリの性能に関する妄想

45nmのCore 2が無事発表されたので。 まず、NehalemファミリはCore 2より1コア当たりの面積が1.5倍になっているらしいです。ただし、SMT*1による増加分が5〜10%あると考え、シングルスレッド性能に影響する部分は40〜45%増としておきます。 んで、ポラックの…

絶対位置による駒の評価を修正

今までは駒の位置・種類・手番ごとにパラメータを用意していたのですが、これを「先手のx筋y段の種類tの駒」と 「後手の10-x筋10-y段の種類tの駒」で共通にしました。 今まで別のパラメータを用意していたのには 先手と後手で絶対位置による評価値は別の可能…

公式

コンピュータ将棋のWikiを見ていて、何の公式かパッと見で分かりませんでした。 ダメだ俺、何とかしないと。

αβの高速化は

MTD(f)って選択肢もあるのを忘れていました。 去年の選手権で採用して、バグで落ちまくった苦い経験があるからか、すっかり頭から抜けていました。 あ、念の為に書いておくと悪かったのは私の頭で、MTD(f)には何の原因もありません。 将棋関連 将棋用の評価…

PenrynファミリのCore 2 Duo/Quad発表

発表記事 http://pc.watch.impress.co.jp/docs/2008/0108/intel.htm レビュー http://www.4gamer.net/games/030/G003078/20080108001/ 現行のMeromファミリからは小幅な性能アップ&大幅な低消費電力化って感じでしょうか。 私は買い換えるつもりはありませ…

キーボード到着

なんやかんや色々写ってますが気にしないでください。 分かりにくいですが、ブツはこれです↓ Lenovo ThinkPlus USBキ-ボ-ド ウルトラナビ付 [31P8974]出版社/メーカー: Lenovo発売日: 2003/05/22メディア: Personal Computers購入: 1人 クリック: 168回この…

入玉を忘れてた

何で、追加。他は以前通り。 将棋関連 将棋用の評価関数の実装 駒割 絶対位置による評価 王将との相対位置による評価 二駒の位置関係 王将の動ける範囲 王将周辺の利きの数 先後共通のパラメータを使う様に上記項目を修正 将棋で使う為に強化学習関連のクラ…

色々細々修正完了

上に書いた通り、TDLEaf(λ)関連です。 学習則の部分を重み修正直前の評価値を基準に。 対局中に詰みを発見した場合は、常にグリーディー行動を選択する様に修正。 詰んでいる場合は途中のノードの評価値も学習。 一つ目は、以前はエピソード*1中の評価値を基…

今週の予定

月曜:TDLeaf(λ)の学習部分修正 火曜〜水曜:評価関数の修正&みっちりテスト 木曜:千日手・打ち歩詰め関連の実装検討 金曜:酒飲んで寝る 週末:予備期間 さて、今日はウェブの巡回はサクッと済ませたし、バックアップは今やってるところだし、後は開発す…

まずは評価関数をきちんと作ろう

将棋関連 将棋用の評価関数の実装 駒割 絶対位置による評価 王将との相対位置による評価 二駒の位置関係 王将の動ける範囲 王将周辺の利きの数 先後共通のパラメータを使う様に上記項目を修正 将棋で使う為に強化学習関連のクラスをC++に移植 TDLeaf(λ) 将棋…

ABC探索は断念

共謀深さ算出の為には、何らかの方法でノードの評価値を予測する必要があるのですが、今の私には静止探索位しか思いつきません。 で、「静止探索にかける時間>不要なノードを探索しない事で削減出来る時間」になっちゃって、単純なαβよりも遅くなってしまい…

高速化予定(短期)

とりあえず後一手でβカットが確定している場合の対処は完了。5倍位は速くなったか? それから、関連して細々したバグも潰して、そこそこまともになったっポイです。 後1手でβカットが起きる時の対処(Inside KFEndの手法) ハッシュ表を組み込み ハッシュの…

今の時間帯になって始動

二日酔いは辛かったっす。 さて、ABC探索を使うと読み筋がどうも変で、角交換の後に馬を作らせて平気な顔をしています。 んで、試しに評価関数を駒割のみにしてみると今度はその症状は出なくなるものの、今度は大抵の兄弟ノードで評価値が同じになってABC探…

休日にしては早起きしましたが

二日酔い・・・_| ̄|○ とても開発出来る体調じゃないっす。

高速化予定(短期)

後1手でβカットが起きる時の対処(Inside KFEndの手法) ハッシュ表を組み込み ハッシュの最善手をオーダリングで上位に持ってくる 静止探索で得た上界・下界を保存、次回探索時に再利用 学習で必要なのでPVも保存

どうも動作が変

PVの打ち切り深さ*1と平均の打ち切り深さを比較したりとか色々ログを出してみたんですが、どうもPVより他の部分を深く探索している様です。 となると、根本的にどっか変な可能性があるので、高速化は後回しにしてちゃんと動く様にしておくのが先ですね。 怪…

ABC探索は動いた・・・のか?

一応コンパイルエラーも実行時エラーも出ない状況になって、PVもちゃんと取得出来る様になりました。 が、同条件で比較すると、手数打ち切りのαβより遅い。これでは無意味です。 という訳で高速化の方針を検討中。 まずはInside KFEndの「静止探索値を求める…

酔デバッグ

正攻法じゃぁどうにもならなさげなので、久しぶりにやってみます。

今年の抱負

と言うか、次回選手権の抱負。個人的な感覚として、年の区切りが選手権になってるんでw HIT将棋さんにリベンジ*1 一次予選で勝ち越し(1/2修正) 死ぬ気で強化学習将棋を完成させる バグで落ちない ちゃんと参加する 前日夜に飲みすぎて二日酔いにならない …