08/10/06 05:30:14 Gjt1lbWv
Sandy Bridge世代ではいまだに内部128bitである根拠
◎AVXではメモリアドレッシングで指定されたソースに対しミスアラインロードを許容するが、
SIMDユニットがネイティブで256ビットをサポートするとすれば、アラインメント補正処理を
ユーザーに開放したvpalignrの256bit版がないのはおかしい。
シフト・ローテート処理が128ビットのままでは、スループット的にアンバランスが生じる。
◎256bit化の対象となってる浮動小数演算は、SIMD演算ユニットが内部128bitのまま256ビット版を使う
・命令レイテンシ隠蔽のため引き伸ばすだけでも実効性能は伸ばせる。
・SandyBridge世代においてもなお16バイト/clkまでしかないらしい命令フェッチ帯域の節約になる。
まあ俺はどっちでもいいよ。
内部256bitといい続けることで恥をかくのはお前だけだから。