05/07/25 19:10:24
>>39
内積やってないけど、抜けたらせっかくのインラインが遅くならない?
俺ならシャッフルして2つ同時に足すかな。
xmm0=(a,b,c,d), xmm1=(e,f,g,h) として、
movaps xmm2, xmm0
shufps xmm0, xmm1, hoge
shufps xmm2, xmm1, hoge
するとこうなる。
xmm0=(e,f,a,b), xmm1=(g,h,c,d)
で、addpsやって同じようにもう1回足せば出るかな。
面倒なのでここまで。すまぬ。