GA将?開発日記~王理のその先へ~

ネタ勢最強を目指して絶賛開発中。

2008-10-01から1ヶ月間の記事一覧

Larrabee解説記事 @ PC Watch

http://pc.watch.impress.co.jp/docs/2008/1031/kaigai474.htm マスクレジスタってどっかで聞いた事あったと思ってたら、スパコン用のベクトルプロセッサでも同じものがあるみたいですね。 分岐関連でも面白そうな事が出来そうですし、色々遊んで楽しめそう…

今年のGPWは不参加の方向で

開発もしたいですし、有給含めた三連休は引き籠もります。 んで、参加費と旅費が浮いたから、その分は学習用マシンにつぎ込もうかと検討中。 とりあえず静音化の為にSSD買って、電源もそろそろ新しいのにして…って、ケース以外全とっかえコースですね、こり…

ダラダラと実装中

先週末から風邪ひいてて、だいぶ開発が遅れてました。 んで、メタ強化学習の前に、Actor-Criticとしてちゃんと動いてるかどうか確認する為に、迷路脱出タスクを解かせてみる事にしました。 んで、今日はリハビリがてら迷路関連をチョコチョコと。正直、書く…

九十九電機が民事再生

http://pc.watch.impress.co.jp/docs/2008/1030/tsukumo.htm うーん、大須はPCショップの数自体が少いから、九十九がつぶれたりしたら困りますねぇ。ガンバレ。 てか、Core i7発売直前ってのはタイミングが悪すぎです orz

色々修正

開発の方はさっぱり進まないです。この分だと、年内に完成も難しいかも… リバーシでの予備実験 TDLeaf(λ)実装。 メタ強化学習で、状態を見て行動選択する様に変更。 メタ強化学習で、状態の表現方法を検討。 εグリーディーとソフトマックス手法の比較。 TDLe…

データ採取完了

10/20の開発日記に書いた値でOKでした。

元に戻ってデータ採取

数パターンを自動実行出来る様にしたんで、一晩動かせばOKのはず。まずはパラメータ調整をちゃんとやります。 それから、リバーシもとりあえず学習用マシンで動かしときます。メタ強化学習あり・無しで何か差が出ると嬉しいなぁ…

とりあえずメタ強化学習完成

「構想していた案を実装出来た」ってだけで、まだちゃんと動いてるかどうかすら怪しいですが。 んで、多分学習に時間がかかるんで*1、一晩走らせておきます。 それからGA部分にバグ発見。 以前のデータ採取用に初期値を片寄らせてあったんですが、それがその…

GA関連のメタパラメータ調整完了

ベストだったのは下記の通り。 個体数:16 世代更新の間隔:50 次世代に残すエースの数:8 突然変異率:0.125 つー訳で、明日からはリバーシでテスト。

メタパラメータ調整が一部完了

以前やってたのだと、パラメータと得られる報酬の期待値のグラフが単峰性になって、ちょっとテストとしては簡単すぎると思い、問題を修正してリトライ。 んで、まずはGAの個体数と世代更新の間隔*1から。 おおざっぱな傾向としてはこんな感じ。 個体数に対し…

AMDのDenebは2009年以降

http://www.4gamer.net/games/039/G003983/20081018002/ AMD日本法人の公開したロードマップなので、今の所は正確な情報だと思います。 んで、今年中にはサーバ向けのShanghaiが登場して、デスクトップ向けのDenebは来年みたいですね。

データ採取用のコード実装

実行に物凄く時間がかかってます。 これは、一晩動かさないとろくなデータが取れなさそうな感じですねぇ。困った。

メタ強化学習の動作確認完了

とりあえず10本腕バンディット問題を解くエージェントのメタパラメータ調整をさせてみました。 んで、ちゃんと動いた事は動いたんですが、GAの個体数とか世代更新の間隔*1とかは、もうちょっとちゃんと設定しないといけない感じですね。 今は一パターンの設…

Volari Z7 2枚目ゲット

2枚あわせて1枚分の予算で買えました。 ついでに、今更買えないと思ってた新品ですし、結構嬉しいです。

メタ強化学習の再実装完了

とりあえずコンパイルエラーが出なくなるまでは。動作確認やらデバッグやらは明日やります。

X58マザー情報 @ the voices

開発中なんですが、チョイと息抜きに。 http://www.gdm.or.jp/voices.html の10/11分。 ASUSのP6T DELUXEが予価\40,000前後だとか。意外と安い。 メモリも3枚組で発売されるみたいですし、順調にパーツを揃えれそうです。 そういえば「11/17に販売解禁となる…

オークション続き

という訳で落としたブツですが、Volari Z7搭載ビデオカードです。 同じチップを載せたボードの紹介はこちら。2D限定で低消費電力なサーバ向けチップみたいです。 という訳で、当然の様に学習用マシンに積む予定。基本的にリモートデスクトップで操作しますか…

メタ強化学習の再実装中

行動選択する部分以外は完成。残りは以前のバージョンをほぼ流用可能なはず。 今はJavaで作ってて、後で将棋用にC++に移植する必要があるのですが、とりあえずは移植の事は考えずに実装しています。どうせ何度も修正してぐちゃぐちゃになりますから、移植時…

そろそろ開発開始しようと思ったんですが

オークションで落札出来るかが気になって集中出来ません orz 何を入札中かは落としてから書きます。

LGA 1366対応CPUクーラー

http://www.watch.impress.co.jp/akiba/hotline/20081011/etc_dynatron.html Xeon 5500(Nehalem-EP)対応って事ですが、Core i7(Bloomfield)も同じLGA 1366なので、多分使えるんでしょう。 Core i7発売時にはクーラーの選択肢が無いかもしれないって思っ…

学習用マシンが不調

LANチップのドライバ内でエラー発生→再起動→BIOSの設定が変になる ってコンボが発生していたみたいです。 …BIOS画面すら映らないんでグラフィックカードの不調かと疑って、一時間程ドタバタしてたのはここだけの秘密。 ……CMOSクリアって選択肢がトラブル発生…

AMDがファブを分離

http://pc.watch.impress.co.jp/docs/2008/1008/kaigai471.htm リンク先でこれでもかってぐらい解説があるので一言だけ。 こけるなよ、Intelの独走だけは防いでくれ、AMDさん。

ログ表示まわりを整理してみました

あっちこっちのオブジェクト*1に表示すべき情報があって、それをいちいち集めて回るのは手間がかかるので、その辺が楽になる様に。 んで、その修正はすぐに終わって、その後にログを見てみたんですが、どうも探査(色々な行動を試して、今より良い行動を探す…

GPW 2008のスケジュール(案)が発表されていました

http://sig-gi.c.u-tokyo.ac.jp/gpw/2008/schedule.html 今後変更される可能性があるそうなので、とりあえずセッションの表題だけ眺めてみました。 で、参加、どうしようか。 初日は有給取ってあるので参加も可能ですが、三日間引き籠もって開発するのも捨て…

基本に戻って調査中

4x4のリバーシで実験してみました。 TD(0)・εグリーディー(ε=0.01)・テーブル形式評価関数は成功 TD(0)・ソフトマックス(温度=0.75)・テーブル形式評価関数は成功 TDLeaf(λ)・αβ1手・ソフトマックス(温度=0.75)・テーブル形式評価関数は失敗 TDLeaf(λ)…

Core i7 & X58マザー予約開始 (ただしヨーロッパ)

http://pc-benchmark.at.webry.info/200810/article_63.html i7の2.93GHzとP6T Deluxeを狙ってるんですが、意外と安いです。 まぁ、あくまでユーロの価格なんで、日本で同じ値段になるとは限りませんが。

ソフトマックス方策実装&メタ強化学習開始

まずリバーシ用にソフトマックス方策を実装。εグリーディーよりは良さそうですが、4x4のリバーシでも最適解は発見出来ず。 以前に多碗バンディット問題で実験した感じでは、ソフトマックス方策はメタパラメータの少しの差で結果が大きく変わるので、手作業で…

AMD CPUロードマップ @ 4Gamer.net

http://www.4gamer.net/games/039/G003983/20081002003/ 45nmプロセスのPhenomは例によって遅れるそうです。2009/2Q以降って話なので、次回選手権に間に合うかはは微妙ですね。 ただ、Opteronの方は今年中には出す予定だそうですから、ひょっとしたらそっち…