14/05/17 23:04:52.14 HlllZZ0dQ
>>345
検討してみます。VCって自動でアンループしてくれるのだろうか……
そういえば、128bitAVX整数演算ならIvyでも使える(AVX2の範囲ではない)んですよね?
イントリでどうやってAVX側に設定するのかがイマイチ分からなかったので、
「<emmintrin.h>」を「<immintrin.h>」に書き換え、コンパイル時に「arch:AVX」としてみました。
結果、4コアで26000[kTPS]→29000[kTPS]に。大成功、かな?