08/12/02 16:47:29
>>261
> 逆に言えば、上の例だと 5CPU以上ダメじゃん。
4ノードの時点で16CPUなんだが・・・
まぁいいや5ノードで書いてみる。
■データ転送がクロスバーの場合、↓のようにデータ転送は多対多で同時に行えるので、
64バイトの転送を16バイトずつ4クロックに分けてもOK
ステップ1) ノードAのCPUがノードCのメモリの読み取りを要求
ステップ2) ノードBのCPUがノードDのメモリの読み取りを要求
ステップ3) ノードCのCPUがノードEのメモリの読み取りを要求
ステップ4) ノードDのCPUがノードAのメモリの読み取りを要求
ステップ5) ノードEのCPUがノードBのメモリの読み取りを要求
略
ステップ6) ノードCのメモリから、ノードAのCPUに向けてデータ転送開始
ステップ7) ノードDのメモリから、ノードBのCPUに向けてデータ転送開始
ステップ8) ノードEのメモリから、ノードCのCPUに向けてデータ転送開始
ステップ9) ノードAのメモリから、ノードDのCPUに向けてデータ転送開始
ステップ10) ノードBのメモリから、ノードEのCPUに向けてデータ転送開始
略
ステップ11) ノードCのメモリから、ノードAのCPUに向けてデータ転送終了
ステップ12) ノードDのメモリから、ノードBのCPUに向けてデータ転送終了
ステップ13) ノードEのメモリから、ノードCのCPUに向けてデータ転送終了
ステップ14) ノードAのメモリから、ノードDのCPUに向けてデータ転送終了
ステップ15) ノードBのメモリから、ノードEのCPUに向けてデータ転送終了