ポーカーの最強プログラムが出来たらしい
ねとらぼ @itm_nlab
人工知能の歴史にまた1ページテキサスホールデム(ポーカー)の必勝プログラムが完成 ついに不完全情報ゲームでもコンピュータが人間を上回る - ねとらぼ http://nlab.itmedia.co.jp/nl/articles/1501/09/news108.html … @itm_nlabから
https://twitter.com/itm_nlab/status/553449457535033344?lang=ja
kmo2 @kmo2
https://twitter.com/kmo2/status/553453158937018368?lang=ja
CFR=「あの時ああしていれば!という後悔を最小化するアルゴリズム」 / “テキサスホールデムの最適解は求まるか | Scene Research Station” http://htn.to/XDC9RdFi4
ぷるたん @purutan2000
https://twitter.com/purutan2000/status/553455783233339392?lang=ja
ポーカー解いたとかいう論文読んでみてるけど「すっごいマシンでCFRやったよ!」って書いてあるようにしか見えない。そりゃ非常に強くはなるだろうが解いたわけじゃないじゃん。
一つ目と二つ目のツイートのリンク先が詳しく解説していますので、詳細はそちらで。
ものすっごく大雑把に書くと、合計4000コアのCPUを2ヶ月間ぶん回してCFR+というアルゴリズムで学習させた結果、ポーカの一種を「解明した」と主張しているらしいです。
まぁ、本当に解明したのかもの凄く強くなった「だけ」かは原論文に当たってみますが、面白そうな話ではあります。
んで、以下備忘録。
まずCFRの提案論文 → http://poker.cs.ualberta.ca/publications/NIPS07-cfr.pdf
今回の論文 → http://www.sciencemag.org/content/347/6218/145.abstract
論文読み終わったら続報を書くかもです。