07/05/05 14:41:51 AbFnzEoN
AMD Family 10h Processors 最適化ガイドルが公開された
URLリンク(developer.amd.com)
URLリンク(www.amd.com)
とりあえず自分が気づいたことを書いておく
SSSE3/SSE4.1/SSE4.2はない
整数SIMDのレイテンシは2のまま
シャッフル/パック/アンパック/シフトはMeromのような128bit化のペナルティはない
またK7/8同様にFADD/FMULの両方のパイプラインで実行できる
水平加減算も垂直加減算と同じコストで実行できる