Core2 Duonoレポートと解釈

大原雄介さんのベンチマークテスト
http://journal.mycom.co.jp/special/2006/conroe/
安藤さんの解釈
http://www.geocities.jp/andosprocinfo/wadai06/20060805.htm
 大原雄介のベンチマーク記事は独自のものを含んでいて、とても良いのだけど悪いところは言わないので、文章だけ鵜呑みにすると間違ってしまう。今回は安藤さんが解釈してくれたので、そちらを読みながらベンチマークをみる。
 Core2 duoは4実行器を持っており、命令実行の並列性の高さが特徴なのだけど実はx86命令のデコードが足りずにAthlonと変わらない命令実行になっている。1クロック16Bで5命令まで解釈できるはずなのだけど、ベンチマークの単純な命令さえ3命令しか取り込めていない。後藤さんの記事から広まった64bit時にプリフェッチ/デコード帯域の制限で性能が低下するという話は、そもそも32bit時から制限されているという話になりそう。
 Athlonに対してクロックあたりの2割増しの性能は、データキャッシュの帯域やレイテンシ、投機ロードなどのデータアクセスの優位性から出たようだ。ここまで原因が明瞭ならAthlonはキャッシュ、投機ロード、Intelはデコードと次の改良点を決めやすくて良いじゃないか。それにしてもx86はデコードがやはり重い、性能向上されるには遡源をデコードへ割り振る量を更に増やさなければならない。本当にそれで良いかという疑問は残ってしまうわけだ。