【IT】米エネルギー省とIBM、発注したスパコンの世界初、実行性能1026Tflops達成を発表

【IT】米エネルギー省とIBM、発注したスパコンの世界初、実行性能1026Tflops達成を発表at WILDPLUS

【IT】米エネルギー省とIBM、発注したスパコンの世界初、実行性能1026Tflops達成を発表 - 暇つぶし2ch1:ばい夫 ◆iYaruoQt66 ＠釣りﾁﾙﾄﾞﾚﾝ29号(080731)φ ★
08/06/15 10:20:11 BE:482334473-2BP(5020)
2008年6月9日に米エネルギー省とIBMは、同省NNSA傘下のLos Alamos研究所(LANL)がIBMに発注しているスーパーコンピュータ　
Roadrunner（RR）が、Linpackの実行性能で1026Tflopsを達成し、世界で最初の1PetaFlops機となった事を発表した。
RRのスケジュールは2009年初頭にLANLへ納入予定であるが、半年前の今月にIBMのポーキプシ（Poughkeepsie）工場での
組み立てが完了し、Linpackの測定が行われたということのようである。RRの最大の特徴は、IBMの市販のBlade Server Boardで
構成されていることで、このため、組み立てが非常に順調に進んだものと思える。

RRは、いわゆる、「Hybrid型」とか「FPUアクセラレータ型」と呼ばれている方式のスパコンで、Linpackの性能はともかくとして、
衆目一致で世界最速として認められるためには、HPCCベンチマークでのデータは必須で、HPCCの発表のある11月までには、
ぜひ、データのサブミッションを願いたいものと思う。
　
LLNLのBG/Lは2006年に360TFlopsの旧システムでのサブミッションを行い、HPCCの主要4項目で全て第1位を獲得し、
名実ともに世界最速と認められたが、2007年の拡張強化版ではサブミッションを行わなかったため、Red Storm（Opteron）に
FFTの分野で第1位を奪われている。
Hybrid型は「汎用」に関しては疑問符がつけられており、RRのHPCCベンチマーク・データが注目される。

RRの基本ノード構成は、IBMの市販のBlade ServerであるQS22を2枚とLS21を1枚、及びこれらの接続用の拡張ボード1枚の
合計4枚構成で、Tri-Bladeと呼ばれている。
1シャーシにこのTri-Bladeノードを３セット組み込み、1ラックには４シャーシ、12ノードを組み込み、15ラック180ノードを設置単位の
CU（Connected Unit）としている。　CUにはCPUラックのほかIOノードやサービス・ノードが必要で、CU全体は16ラック程度の構成と考えられる。

QS22はPS3用のCellの倍精度強化版であるPowerXCell8i（3.2Ghz）を2ソケット保持している。QS22の営業用スペックでは倍精度の
ピーク性能は217Gflops（チップ当り108.8）となっているが、これはPPEx1+SPEx8の合計である。RRではPPEを演算用には使用しないので、
QS22の実質のピーク性能は204.8Gflops（チップ当り102.4）で、RRのピーク性能はこの204.8Gflopsをベースにしている。

LS21はDual core Opteronの2ソケット版のBladeで、このOpteron 4コアは、それぞれのコアが、QS22上の各Cellチップに対応することに
なっている。RoadrunnerのLS21は1.8Ghz版である。

コネクションは、ノード内のLS21-QS22はPCI-E x8（2/Cell、2GB/s）、ノード間はIB 4x DDR(2GB/s)である。
ノード内のメモリのハイアラーキは、LS21Blade内に、OpteronからはNUMA、CellからはDistributed型の、16GB（各コア当り４GB）、
各QS22にCell用のNUMA型の8GB（チップ/PPE当り４GB）、各SPEにLocalメモリ（キャッシュ）が256ＫBである。　

転送速度はLocal Memoryへは全体で25.6GB/s（0.25B/F）、QS22 Blade内NUMA MemoryはCell当り21.3GB/sである。

Tri-BladeノードのピークはQS22 x2 で、409.6Gflopsであり、ラックのピークは4.92Tflopsである。CUのピークは73.73Tflopsとなり、
システムのピークは1.3271Pflopsである。
この結果、Linpackのシステムでの実行性能1026Tflopsは、ピークの77.3%で、
Petaflops超級の巨大システムの実行性能としては合格であろう。

消費電力は3.9MWで、Blue Gene/Pと同等のレベルである。設置面積は5500ft**2（459平米）で
地球シミュレータ（3250平米）の6分の１弱。296ラック構成であるが、計算ノードは270ラック程度。

価格に関してはIBMは約$100M（約110億円、\$110）と発表しているが、NY Timesは＄133M（約146億円）、
HPCwireは$120M（約132億円）と報じている。

IBMの発表は、1Peta機の現在の市販価格での総額と考えられるが、NYTimesやHPCwireの価格は、初期の調査費、
昨年の70Tflops機の費用などを含めた、プロジェクトの総経費を指しているものと思える。
　
QS22の米国でのIBM Directでの価格は$10K程度で、日本でも130-140万円程度、LS21の1.8Ghz版は$5Kもしないと思うので、
Tri-Blade（Node）の価格はインターコネクトを含めて$30K（約330万円）以下で有ろうと思う。このノードを3240セット
（18CUｘ180 node）購入すると,概ね、$100Mとなるので、IBMの発表と合致する事になる。ただし、設置費用、有償ソフトウエア等は
除く事になるが、当らずといえども遠からずであろう。

(続き>>2以降)
URLﾘﾝｸ(japan.cnet.com)

レスを読む