09/09/24 02:00:01 T8IJkI3d
ARCS002
How To Optimize Your Software For The Upcoming Intel(R)
Advanced Vector Extensions (Intel(R) AVX)
p.6 Sandy-Bridgeのブロック図
気になるのは port-0のAVX-HIGHとport-1のAVX-LOW
256bitを2つの128bitに分割して実行するのだろうか
だとすると現在とパフォーマンスは殆ど変わらない
可能性もある
>>478のIACAのモデルになっている架空のCPUでは
Nehalemベースにfp-add/mul/shuffleを256-bitにした構成だった