NehalemのL2$は各コア独立だった

後藤さんの記事によると、Nehalemの2コア毎の共通$と思われていたL2$は各コア独立で、L3$のみ共通$になる。L2$まではレイテンシを減らすために少容量とし、それ故に共通$にするメリット減少しているようだ。商品としてバリエーションを増やせるメリットあると考えている。

IntelとAMDが同じ$階層を持つことは面白い。両社とも、マルチコアを使うプログラムが密接してデータ処理を行わないと想定していることを意味している。ストリーム・プロセッサとは別の方向へ向かい始めている。

もう1つ付け加えると$容量が非常に大きくなっているので、レイテンシの短いSRAMばかり載せると消費電力が問題になり始めたのかも。

L2$構造が今まで謎だったのは半導体の写真にそれらしい場所が見えなかったからだけど、これは各コアのL2$部分が塗りつぶされていたからだ。このため演算処理をする部分の面積を過剰に計算していたことになる。演算器の面積は、現コアの1.5倍と考えられていたが1.3倍程度となる。コア数が増えるのでクロックも大きくは向上しないと思う。1コアあたりの処理能力は、そこそこの向上程度ではないだろうか。