ポーカーの最強プログラムが出来たらしい - GA将？開発日記～王理のその先へ～

ねとらぼ @itm_nlab
人工知能の歴史にまた1ページ
テキサスホールデム（ポーカー）の必勝プログラムが完成　ついに不完全情報ゲームでもコンピュータが人間を上回る - ねとらぼ http://nlab.itmedia.co.jp/nl/articles/1501/09/news108.html … @itm_nlabから
https://twitter.com/itm_nlab/status/553449457535033344?lang=ja

kmo2 ‏@kmo2
CFR=「あの時ああしていれば！という後悔を最小化するアルゴリズム」 / “テキサスホールデムの最適解は求まるか | Scene Research Station” http://htn.to/XDC9RdFi4
https://twitter.com/kmo2/status/553453158937018368?lang=ja

ぷるたん ‏@purutan2000
ポーカー解いたとかいう論文読んでみてるけど「すっごいマシンでCFRやったよ！」って書いてあるようにしか見えない。そりゃ非常に強くはなるだろうが解いたわけじゃないじゃん。
https://twitter.com/purutan2000/status/553455783233339392?lang=ja

　一つ目と二つ目のツイートのリンク先が詳しく解説していますので、詳細はそちらで。

　ものすっごく大雑把に書くと、合計4000コアのCPUを2ヶ月間ぶん回してCFR+というアルゴリズムで学習させた結果、ポーカの一種を「解明した」と主張しているらしいです。

　まぁ、本当に解明したのかもの凄く強くなった「だけ」かは原論文に当たってみますが、面白そうな話ではあります。

　んで、以下備忘録。

　まずCFRの提案論文 → http://poker.cs.ualberta.ca/publications/NIPS07-cfr.pdf

　今回の論文 → http://www.sciencemag.org/content/347/6218/145.abstract

　論文読み終わったら続報を書くかもです。