2007-08-22の続きになるけど、PCwebに安藤さんのレポート
http://journal.mycom.co.jp/articles/2007/09/09/hotchips1/index.html
 チップの構成は以前に報告されていたけど、ベンチマークの種類と結果が載っている。タイルアレイプロセッサに対してMIMDっぽいものをイメージしていたど、2次元のネットワークを持ったコンピュータを1チップにしたものだった。つまらないけど、そりゃそうか。
 分散コンピュータはネットワークの連結度とローカルメモリの量が重要になるけど、通信性能に重心を置いたものがアレイプロセッサということになる。どちらのアレイプロセッサも100個以下であり、ネットワーク構造を考えると最大数はこの辺りになるのでないか。もっと増やす場合はネットワークにバイパスが必要になるだろう。
 GPUと比較すると、GPUは処理をクラスタ化しデータ処理を単純化しているのに対して、アレイプロセッサは各コアの独立性が保たれている点が異なる。単純な画像処理などではGPU、データ探索などはアレイプロセッサが有利になるんじゃないだろうか。

追記

ふと思ったんだけど、Cよりerlangみたいな言語の方がGPUって相性がよいのでないだろうか?プログラム側を残したままデータを仮想的なスレッド処理しているみたいだけど。言語の特徴と実装の上手さが理由っぽい。実装までみないと強みが見えてこなそう。
http://www.atmarkit.co.jp/news/200704/27/erlang.html

  1. 状態変化のない確定的な記載(参照透過性)が並列化に有利?
  2. 遅延評価が個別の処理を軽くして、大量処理を可能にしているようだ。