オンメモリプロセッサという妄想
コーディングしてると時々出てくるのが、メモリアクセスがボトルネックになる現象。
んで、これってメモリ上(か、メモリモジュール上)にシンプルなプロセッサ*1を載せれば解決しないかなぁ、と時々思います。
例えばdouble型の1次元配列が2つあって、内積を計算する場合。
これだと、連続したアドレスからメモリ上の値を読んで掛け算・足し算していくだけですから、プロセッサ・メモリ間を高速化するよりメモリに近い所にプロセッサを追加した方が高速化出来そうな気が。
FB-DIMMが実現出来た訳ですから、DIMMにARMコアを載せるってのも技術的には可能なはず。
問題はプログラミングのモデルをどうするかとかOSのサポートなんですが、そこら辺は誰かに頑張ってもらうとしてw
まぁ、私が思いつく位だから、研究レベルだともう誰かがやってるでしょうね、多分。
*1:ARM系のとか