実験結果 from 金曜

開発日記

大体こんな感じでした。全局面の平均二乗誤差 - 着手数あり着手数なし開放度あり 4.86 5.86 開放度なし 4.97 5.77 対局中に表れた局面の平均二乗誤差 - 着手数あり着手数なし開放度あり 1.53 0.38 開放度なし 0.37 0.72 対局中の平均二乗誤差はid:streak…

2007-09-09

NVIDIAの次世代GPUについて

コンピュータ関連

ネットでの噂だとハイエンドのコードネームがG90で、アッパーミドルレンジがG92らしいです。で、性能的には G90 >>（決して越えられない壁）>> GeForce 8800 Ultra/GTX/GTS ≒ G92 >> GeForce 8600 GTSって感じになるんでしょうか。あくまで勝手な予想ですが…

2007-09-09

大須で色々物色

コンピュータ関連

キャプチャカード*1・グラフィックカード・CPU・電源etc。んで、グッドウィルEDMの4階でよさげなジャンクパーツ発見。ねじ等の小物入れなんですが、8部屋に仕切ってあって部屋ごとにふたが付いてるヤツ。こーゆーのってあんまり売ってないし、あったとし…

2007-09-09

NVIDIA CUDA 1.0のリリースノートを見落としてました

コンピュータ将棋コンピュータ関連

Hardware Support o Additional hardware support added - Quadro FX 5600 - Quadro FX 4600 - GeForce 8800 Ultra - GeForce 8600 GTS - GeForce 8600 GT - GeForce 8500 GT http://developer.download.nvidia.com/compute/cuda/1_0/CUDA_Release_Notes_win…

2007-09-09

メモリリークしてると思ったら

開発日記

二つあるスタックを初期化する時に、片方しか初期化してなかった。てか、片方を二回初期化してた。死んできます＿|￣|○

2007-09-07

実験結果

開発日記

メタパラメータを徐々に変更する効果はかなりあって、誤差が小さくなりました。大体こんな感じ。全局面の平均二乗誤差 - 着手数あり着手数なし開放度あり 4.85 5.44 開放度なし 5.07 5.50 対局中に表れた局面の平均二乗誤差 - 着手数あり着手数なし開放…

2007-09-06

メタパラメータを可変に

開発日記

とりあえずε*1は1.0、学習率は0.05から始めて、対局が終わるごとに0.001^(1.0/50000)倍*2する事にしてみました。今の所7000局程度進んで、対局中に表れた局面での平均二乗誤差が4.5程度*3。明日夜にどれだけ良くなっているか楽しみです。これで上手くいっ…

2007-09-06

実験結果

開発日記

全局面での平均二乗誤差はid:streakeagle:20070905:1188998083とほぼ同じで、対局中に表れた局面だけでの平均二乗誤差はこんな感じ。 - 着手数あり着手数なし開放度あり 4.20 4.43 開放度なし 6.12 3.44 着手可能数・開放度共に無いのが一番誤差が少ない、…

2007-09-05

平均二乗誤差計算を少し追加

開発日記

上で書いた「対局中に現れた局面だけで平均二乗誤差を計算」を実装しました。試しにテーブル形式*1で試すと誤差が3を切りました。多分、時間をかければもっと減るでしょう。関数近似ありの場合*2でも、ざっと動かしてみた感じでは対局中の局面に対しては誤…

2007-09-05

教師あり学習と強化学習の比較結果

開発日記

学習率とかのパラメータは固定して、評価関数で着手可能数とか開放度とかをあり・なし色々組み合わせて一晩動かした結果です。評価関数は、これら二つの項目＋石の位置による評価＋盤上の石の数による評価としました。表に書いた数値は、MinMaxで初期配置か…

2007-09-05

↑みたいな記事書いてると、オンラインの電卓が欲しいなぁ

雑記

どっかのサーバから1ドル何円かを定期的にダウンロードしてきて、それを元に＄と￥の変換をしてくれるやつ。ついでに、ブラウザのプラグインとして動作して、マウスオーバーで変換結果を表示してくれたら神認定。・・・自分で作れってか？「言いだしっぺ…

2007-09-05

Barcelona予価

コンピュータ関連

http://www.dailytech.com/AMD+Prices+Barcelona/article8729.htm 今の所ソースがDailyTechだけなので信頼性は不明ですが、Barcelonaの価格が出ていました。Optern 23xxシリーズモデルナンバークロック TDP 価格 2350 2.0GHz 95W $372 2347 1.9GHz 95W $31…

2007-09-04

4x4のリバーシも不調

開発日記

昨日の夜から学習しているのですが、対局終了まで先読みした結果との平均二乗誤差が割と大きい値です。 Q学習に問題があるのか評価関数の方に問題があるのか不明なので、同じ評価関数を使って強化学習バージョンと教師あり学習バージョン*1で比較してみます…

2007-09-03

ちょｗ誰だよｗｗ

雑記

ラミエルたんで検索してきたのは。ちょっとお話しようか。いい友達になれそうだ。

2007-09-03

ちょっと追加

TODO

リバーシ関連盤面の実装評価関数の実装（あまり複雑な事はしない）石の位置・手番による評価手数と石の数による評価着手可能数開放度この後の進展次第で追加 MinMaxの実装n 探索値との平均二乗誤差の計算 αβの実装必勝読みの実装 ← ここまでの目標 9…

2007-09-03

結局、平均二乗誤差を計算する事に

開発日記

MinMaxでの終局までの先読みを実装して、先読み結果と評価関数の出力の平均二乗誤差を計算するコードを追加。んで、5x5以上だとメモリが足りなくてMinMaxで落ちるので、4x4で実験する事に。まぁ、単純な事だから順調順調。NegaMaxなのにNegaになってない、…

2007-09-03

学習結果

開発日記

微妙。ログを見てみると、学習しているけど遅いだけにも見えるし、学習していない様にも見える。となると、選択肢は大穴狙いでαβを実装して高速化堅実にMinMaxでの完全読みとの二乗誤差を計測のどちらか。・・・って、どの道MinMaxとαβは必要、か。とり…

2007-09-03

ホストOSとゲストOSをシームレスに扱える仮想PC

コンピュータ関連

http://www.forest.impress.co.jp/article/2007/09/03/virtualbox150.html 要するにUNIXでX Window Systemを使った時みたいに、ホストOS*1の画面上にゲストOS*2のアプリを配置出来るらしいです。おまけに、仮想シリアルポートもサポートしてるとかホストOS…