08/06/15 10:20:11 BE:482334473-2BP(5020)
2008年6月9日に米エネルギー省とIBMは、同省NNSA傘下のLos Alamos研究所(LANL)がIBMに発注しているスーパーコンピュータ
Roadrunner(RR)が、Linpackの実行性能で1026Tflopsを達成し、世界で最初の1PetaFlops機となった事を発表した。
RRのスケジュールは2009年初頭にLANLへ納入予定であるが、半年前の今月にIBMのポーキプシ(Poughkeepsie)工場での
組み立てが完了し、Linpackの測定が行われたということのようである。RRの最大の特徴は、IBMの市販のBlade Server Boardで
構成されていることで、このため、組み立てが非常に順調に進んだものと思える。
RRは、いわゆる、「Hybrid型」とか「FPUアクセラレータ型」と呼ばれている方式のスパコンで、Linpackの性能はともかくとして、
衆目一致で世界最速として認められるためには、HPCCベンチマークでのデータは必須で、HPCCの発表のある11月までには、
ぜひ、データのサブミッションを願いたいものと思う。
LLNLのBG/Lは2006年に360TFlopsの旧システムでのサブミッションを行い、HPCCの主要4項目で全て第1位を獲得し、
名実ともに世界最速と認められたが、2007年の拡張強化版ではサブミッションを行わなかったため、Red Storm(Opteron)に
FFTの分野で第1位を奪われている。
Hybrid型は「汎用」に関しては疑問符がつけられており、RRのHPCCベンチマーク・データが注目される。
RRの基本ノード構成は、IBMの市販のBlade ServerであるQS22を2枚とLS21を1枚、及びこれらの接続用の拡張ボード1枚の
合計4枚構成で、Tri-Bladeと呼ばれている。
1シャーシにこのTri-Bladeノードを3セット組み込み、1ラックには4シャーシ、12ノードを組み込み、15ラック180ノードを設置単位の
CU(Connected Unit)としている。 CUにはCPUラックのほかIOノードやサービス・ノードが必要で、CU全体は16ラック程度の構成と考えられる。
QS22はPS3用のCellの倍精度強化版であるPowerXCell8i(3.2Ghz)を2ソケット保持している。QS22の営業用スペックでは倍精度の
ピーク性能は217Gflops(チップ当り108.8)となっているが、これはPPEx1+SPEx8の合計である。RRではPPEを演算用には使用しないので、
QS22の実質のピーク性能は204.8Gflops(チップ当り102.4)で、RRのピーク性能はこの204.8Gflopsをベースにしている。
LS21はDual core Opteronの2ソケット版のBladeで、このOpteron 4コアは、それぞれのコアが、QS22上の各Cellチップに対応することに
なっている。RoadrunnerのLS21は1.8Ghz版である。
コネクションは、ノード内のLS21-QS22はPCI-E x8(2/Cell、2GB/s)、ノード間はIB 4x DDR(2GB/s)である。
ノード内のメモリのハイアラーキは、LS21Blade内に、OpteronからはNUMA、CellからはDistributed型の、16GB(各コア当り4GB)、
各QS22にCell用のNUMA型の8GB(チップ/PPE当り4GB)、各SPEにLocalメモリ(キャッシュ)が256KBである。
転送速度はLocal Memoryへは全体で25.6GB/s(0.25B/F)、QS22 Blade内NUMA MemoryはCell当り21.3GB/sである。
Tri-BladeノードのピークはQS22 x2 で、409.6Gflopsであり、ラックのピークは4.92Tflopsである。CUのピークは73.73Tflopsとなり、
システムのピークは1.3271Pflopsである。
この結果、Linpackのシステムでの実行性能1026Tflopsは、ピークの77.3%で、
Petaflops超級の巨大システムの実行性能としては合格であろう。
消費電力は3.9MWで、Blue Gene/Pと同等のレベルである。設置面積は5500ft**2(459平米)で
地球シミュレータ(3250平米)の6分の1弱。296ラック構成であるが、計算ノードは270ラック程度。
価格に関してはIBMは約$100M(約110億円、\$110)と発表しているが、NY Timesは$133M(約146億円)、
HPCwireは$120M(約132億円)と報じている。
IBMの発表は、1Peta機の現在の市販価格での総額と考えられるが、NYTimesやHPCwireの価格は、初期の調査費、
昨年の70Tflops機の費用などを含めた、プロジェクトの総経費を指しているものと思える。
QS22の米国でのIBM Directでの価格は$10K程度で、日本でも130-140万円程度、LS21の1.8Ghz版は$5Kもしないと思うので、
Tri-Blade(Node)の価格はインターコネクトを含めて$30K(約330万円)以下で有ろうと思う。このノードを3240セット
(18CUx180 node)購入すると,概ね、$100Mとなるので、IBMの発表と合致する事になる。ただし、設置費用、有償ソフトウエア等は
除く事になるが、当らずといえども遠からずであろう。
(続き>>2以降)
URLリンク(japan.cnet.com)