GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

土日やった事まとめ

 ログを分析してみるも、どこにも異常らしき現象は発見出来ず。

 それから、ボルツマン分布のテストも問題無し。ほぼ期待値通りの結果になっていました。


 んで、後の時間は論文読み。

 インクリメンタルサポートベクターマシンによる価値関数の学習

 これは正直言って私が論文の趣旨を勘違いしていたらしい。

 SVMを評価関数として使っているのかと思ってたんですが、そうではなくて初期局面から完全読みした結果から「先手勝ち」「引き分け」「後手勝ち」の3クラスに局面を分類して、SVMを使った分類問題に置き換えてるだけらしいです。

 んで、当然ながら将棋では完全読み不可能なんで適用不可能です。残念。


 強化学習におけるexplorationとexploitationの制御

 こっちはまだちゃんと理解出来ていないんですが、ある程度期待出来そう。

 この手の論文だと、「複雑だが小さい*1問題」にしか適用出来ない手法が多いんですが、この論文はもっと大きい問題にも使えそうです。

 まだ一部ちゃんと理解出来ていない部分があるので、そこはしっかり理解したいです。上手く動きそうなら、コンピュータ将棋にも応用したいですね。

 ところでこの論文、CiNiiで¥1,575で買ったんですが、ほぼ同じ物が無料で公開されていました。

  http://www.jnns.org/niss/2001/Text/file/ishii.pdf

 まぁ、値段分の価値はあった訳ですし、無料版の方は見なかった事にします。

*1:状態・行動数が高々10程度とか