さらに忘れてた分を追加

TODO

選手権終わったらやる事。コンピュータ将棋の改良一からコードを書き直す（現在も進行中）三目並べ・リバーシ・将棋を一つの強化学習エージェントで学習可能にする評価関数は差分計算を基本にする ABC探索 Ponderの実装とりあえず普通の相手番に、対局…

2009-04-26

この前のバグの謎

開発日記

http://d.hatena.ne.jp/Gasyou/20090421/1240307773で書いた評価関数のバグですが、発生条件が「特徴量の二乗の合計が0」でした。で、評価項目として王将との相対位置か二駒の相対位置は常に有効にしているので*1、特徴量の二乗の合計が0になるはずが無いで…

2009-04-26

王手千日手

floodgate

13時の回の対gps_l戦がGA将!!!の王手千日手負け負けだったんですが、そうしないと自玉が詰んで負けるって状況だったみたいですね。今は、王手千日手の評価値は「負け＋100」で、詰んだら「負け＋詰め上がりまでの手数」になってるんで、王手千日手で負けた…

2009-04-25

改めてgoogle凄いかも

雑記

http://www.google.co.jp/search?source=ig&hl=ja&rlz=1G1GGLQ_JAJP322&q=TD%E5%AD%A6%E7%BF%92%E6%B3%95%E3%80%80%E4%B8%89%E7%9B%AE%E4%B8%A6%E3%81%B9&btnG=Google+%E6%A4%9C%E7%B4%A2&meta=lr%3D&aq=f&oq= "TD学習法"と"強化学習"が似た単語だとちゃんと…

2009-04-25

昨夜から参戦中

floodgate

現在レーティング1200チョイって所です。前のオープン戦で手も足も出なかったtohskeに追い付いた？*1 それから、読み筋が変だったんでパラメータファイルを確認したら、4/9のかなり古いファイルでした。これではダメダメなんで、学習用マシンでの最新ファイ…

2009-04-23

ようやくOSが届いた

コンピュータ関連

これでfloodgate参戦用マシンを動かせる様になります。今日はOSその他色々インストールで、明日から参戦予定。

2009-04-21

忘れてた分を追加

TODO

コンピュータ将棋の改良一からコードを書き直す（現在も進行中）三目並べ・リバーシ・将棋を一つの強化学習エージェントで学習可能にする序盤はUCTで指すのを試す ABC探索 Ponderの実装とりあえず普通の相手番に、対局中の局面から学習してみるカブロ…

2009-04-21

OracleがSunを買収予定

コンピュータ関連

http://internet.watch.impress.co.jp/cda/news/2009/04/20/23215.html 結局IBMでもHPでもなく、Oracleがゲットする事になったみたいです。個人的にはJavaの今後がどうなるか気になりますが、まぁ何とかなるでしょう、多分。

2009-04-21

現在の状況

開発日記

この前書いた全幅1手+静止探索4手での学習を動かすと、一晩どころか1時間もたたずににエラー吐いて止まってました。で、その原因が評価関数のパラメータ調整ルーチンのバグ＆千日手の評価値の扱いのバグだとやっと判明したのが昨日の夜。その後とりあえず…

2009-04-16

意外とやる事残ってる

TODO

将棋の学習関連 TDLeaf(λ)エージェントを再実装。方策をエージェントから独立させる。学習中の各種統計情報の収集・表示ルーチン実装。 std::vectorあたりを勉強しとくこと。王手将棋での予備実験。 εグリーディーとソフトマックス手法の比較。評価関数…

2009-04-16

2〜3日分、200万局ぐらい（多分）

開発日記学習経過

ちょっと前に学習させて、そのまま放っておいたパラメータを軽くテスト。強いとは言えないけど、まぁ悪くないレベルなんで、選手権用としてとりあえず確保しときます。んで、今までは方策内部で1手全幅で読んで、その先で静止探索1段目4手＋2段目無制限*1で…

2009-04-15

モンテカルロどうぶつしょうぎに反応してみる

コンピュータ将棋

id:tihara:20090415:p1 ５五将棋よりさらに小さいどうぶつしょうぎでのモンテカルロを実際に作られた様です。ランダム指し→原始モンテカルロ→さらに改良と、だんだん強くなっていったみたいです。それで、将棋で強化学習をしている者の立場から、感想とか気…

2009-04-15

WILLCOM NS

コンピュータ関連

http://www.willcom-inc.com/ja/lineup/ws/026t/index.html インターネットアクセス専用の端末というコンセプトは面白いと思いますけど、出来ればもうちょっと画面が大きい方が嬉しいなーとか考えたり。あと、今持ってるWILLCOM 03と二台持つとなると、正直…

2009-04-15

GAを用いて物理法則を自力で発見したプログラム

雑記

http://pc.nikkeibp.co.jp/article/news/20090415/1014307/ 色々な振り子の運動の様子をデータとして与えて、そこからGAで運動の様子を記述する式を作ったらしいです。現時点では「使い勝手の良いツール」って位置付けらしいですが、将来もっとすごいのに発…

2009-04-15

選手権持ち物リスト（案）

雑記

PC及び電源・マウス・LANケーブルプログラムとソースコード名刺暇つぶし用の本オーディオプレイヤー着替え普段飲んでる薬あと、選手権までにやる事。ノートPCへの開発環境インストール＆動作テストノートPCの壁紙を人に見られても恥ずかしくないの…

2009-04-14

floodgate参戦用マシン、組んじゃいました

コンピュータ関連

色々あって、半衝動買い (｀・ω・´) 近所のエイデンでパーツ揃えました。 CPUは結局Athlon X2 5050eにしました。 Pentium DCと組み合わせれるローエンドチップセット（G31とか945GC）はメモリが4GBまでしか積めないので、それならいっそAMDで組もう！という…

2009-04-12

Atomマシン構成案

コンピュータ関連

OS Windows XP Professional（32ビット版） M/B Jetway NF94-270-LF（Atom N270＋945GSE） RAM DDR2 SO-DIMM 2GB適当なの HDD Seagate Momentus 5400 PSD（ハイブリッドHDD・流用）光学ドライブ USB外付けの適当なのケース A-ITX-100P080 Atomに速さを求め…

2009-04-12

選手権終わったらやりたい事まとめ

TODO メモ

まぁ、選手権の対局を見てればこれ以外にもやりたい事が出てくるでしょうけど。 Atomで一台組む（floodgate等に）コンピュータ将棋の改良一からコードを書き直す（現在も進行中）三目並べ・リバーシ・将棋を一つの強化学習エージェントで学習可能にする …

2009-04-09

一旦整頓

TODO

将棋の学習関連 TDLeaf(λ)エージェントを再実装。方策をエージェントから独立させる。学習中の各種統計情報の収集・表示ルーチン実装。 std::vectorあたりを勉強しとくこと。王手将棋での予備実験。 εグリーディーとソフトマックス手法の比較。評価関数…

2009-04-09

Lesserkai相手に23勝0敗0分け

開発日記学習経過 floodgate

という訳で、今朝のパラメータ＋ちょっと修正したプログラムでfloodgateに復帰。修正内容は乱数を少し大きく*1しただけです。それから、学習用マシンには評価項目を増やしたバージョンをパラメータ持ち越しで投入。今の項目はこんな感じです。駒割絶対位…

2009-04-09

現在10-0-0（vs Lesserkai）

開発日記学習経過

20-0-0になったらfloodgateに投入します。

2009-04-09

漫遇将棋の紹介記事＠ Yahoo!

コンピュータ将棋

http://headlines.yahoo.co.jp/hl?a=20090409-00000575-san-bus_all ざっと読んだ感じだとニューラルネットワークを使ってるッポイですけど、実際の所そこまでは明記されてないですし、詳細は不明。とりあえず、なんか新しい事をしてて強いらしいという位は…