17/07/16 15:25:32.89 Jy1Mj1U4.net
>>752
そうとも言えん
幅が増えりゃ増えるだけ付随部も肥大化する
幅だけ増やしたらデータが詰まる
例えば512だと要素は32x16、コレを一気に処理出来なければいけない
出来なければいけないってのがポイントだ
だとすれば必然的に足廻りやその他もそれだけの大きさを制御出来ないと性能は下がる
AMDの今回のアプローチは真逆で、SIMDで行う「多重並列」処理は当然並列なのでマルチスレッドでは基本リニアにスケールする
この場合、例えば512を2コア実装するのと128x2を4コア実装するのでは理論値は一緒で、しかし他が同一だとすればキャッシュ量と帯域幅は後者が前者の倍になる
あと一般向けに使うぶんにはそんな超幅演算機は電気の無駄でしか無い
16要素同時演算、確かに速いがCPUでやるべきじゃ無く、当然当人もPhiを出してるからにはわかってる筈
AVX512はつまりそういうもの、バケモノみたいなデータを少ない命令で占有させて回したければ都合がいいけどそれ以外が不味過ぎる
スパコンとかHPC向きであって電力ぶっ壊してまで一般向けに下ろすようなもんじゃ無いんだよ