GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

対局開始直後の指し手をランダムにして探査を促進する方法

イデアメモってほどじゃないんですが、表題の件を考えていました。

対局開始後数手*1は完全にランダムに指し手を選べば、自然とその後の展開も違ってきて、結果として色々な局面を学習出来るんじゃないかと虫の良い事を考えてます。

強化学習

強化学習

  • 作者: Richard S.Sutton,Andrew G.Barto,三上貞芳,皆川雅章
  • 出版社/メーカー: 森北出版
  • 発売日: 2000/12/01
  • メディア: 単行本(ソフトカバー)
  • 購入: 5人 クリック: 76回
  • この商品を含むブログ (29件) を見る

んで、これって上記の本に似た事が書いてあったなと思い、読み返したら、"開始点探査"でした。

実際は開始点探査そのものではないですが、まぁ考え方は近いって事で。

さて、これはGW中に実験してみて、上手く行きそうなら採用しますか。

*1:2〜4手位の予定ですが、実験結果次第で変更。