10/05/23 21:24:17 x6ZWwWBz
日本法人の酷い訳きました
URLリンク(download.intel.com)
あ、これとか?
Fused Multiply Add (“FMA”)
- Not supported on IntelR Microarchitecture (Sandy Bridge)
? ± A*B ± C; IEEE-754-2008 compliant (only round is at the end)
? 3 formats allow selection which of A, B & C comes from memory
and which one is being overwritten
・ vFMAdd<nnn> srcdst1,src2,src3/mem, where <nnn> can be:
・ 132: srcdst1 = srcdst1*src3/mem+src2
・ 213: srcdst1 = src2*srcdst1+src3/mem
・ 231: srcdst1 = src2*src3/mem+srcdst1
? Key benefits:
・ 1) Increased FP compute density
・ 2) Improved numeric accuracy
・ 3) Benefits vector and scalar workloads
(software.intel.com/file/24742より引用)
意訳すると、乗算と加算に分解するのではなく、本物の積和算ユニットを持ち、
なおかつスループット向上をも目指すということ。
ここまで出れば確定的に明らかでは?