09/01/12 18:04:49 nJjDJ95S
>>162
答えはこれでいいかな?
Scientific Computing Kernels on the Cell Processor
Samuel Williams, John Shalf, Leonid Oliker, Shoaib Kamil, Parry Husbands, and KatherineYelick
International Journal of Parallel Programming (c)2007
URLリンク(bebop.cs.berkeley.edu)
> Cell has a 7 cycle in-order execution pipeline and forwarding network
実際問題Intelは"operand forwarding"って表現をしてる(実はIBMも)
"operand buffering"とか"operand bypassing"っていう学者さんもいる。
"forwarding network"っていわゆるTCP/IPのアレのほうが一般的で
CPUアーキのそれは画一的な呼び方がないのが現実。
実装方法も全然別物だからな。
わかりやすい例を出すと、x86は演算対象がレジスタだけじゃない。
------------------------------------------------------------
で、実際の実装の話。ちょっと実機でベンチマークしてみたんだけど
stqd $10, 32($sp)
lqd $11, 32($sp)
stqd $12, 32($sp)
lqd $13, 32($sp)
こんなコード。ちょっとこれは俺もびっくりしたんだけど
勘違いでなければLocal Storageに対するストアフォワーディングが利いてるかもしれない。