06/12/19 06:34:14
まだあきらめてませんぞw
その後Cellの方のプログラムをSIMD化してみたんだけど、すんげはやくなった。
Pen4が4秒かかる計算がCellでは20秒。
ただしCellはSIMD化してるので、演算量は4倍。だからspe一基でPen4にほぼ匹敵。
普通の算術演算子でコードするより、SIMD用の関数でコードするほうが全然早いよう。
ベクトル演算だから4倍早いっていう意味じゃなくて。
a+bよりspu_add(a,b)のほうが断然レイテンシが小さいようだということ。
でもちゃんとクロック単位で計測とかしたわけじゃないんでわからんが。