14/05/18 10:24:31.08 Yb0pZxHcU
>>354
>3オペランド化……ひょっとしてコンパイラが仕事しない場合は手作業ってことですかね?
そうで~す。
> ……movduaがvmovdquになってるのってまさかアライメント的な問題?
ですね。128bitなら_declspec(allign(16))でいいはずです。
あとマイクロアーキテクチャによってどのストア命令が速いか違うんですよ。
NehalemはMTFでは特別扱いです。
AVX/AVX2 vmovdqa
SSE2 movaps
SSE2 (Nehalem) movdqa